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OM nucleic - nucleic search, using sw model 

Run on: June 25, 2004 , 06 : 11 : 13 ; Search time 4270.53 Seconds 

(without alignments) 
13027.239 Million cell updates/sec 

Title: US-10-054-68 0-3 

Perfect score: 1863 

Sequence : 1 atggcgtggttaaggttgca ggaaagccagtattgggtga 1863 



Scoring table: 



IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 27513289 seqs, 14931090276 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



55026578 



Database : 



EST: 
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em_estba : * 
em_esthum: * 
em_estin: * 
em_estmu: * 
em_estov: * 
em_estpl : * 
em_estro : * 
em_htc: * 
gb_estl : * 
gb_est2 : * 
gb_htc: * 
gb__est3 : * 
gb_est4 : * 
gb_est5 : * 
em_estfun: * 
em_estom: * 
em_gss__hum: * 
em_gss_inv: * 
em_gss_pln: * 
ern_gss_vrt : * 
em_gss_fun 
em_gss_mam 
em_gss_mus 
em_gss_pro 
em_gss_rod 
em_gss_phg : * 
em_gss_vrl : * 



28: gb_gssl:* 
29: gb_gss2:* 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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1784.4 


95. 
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1788 


29 


AY401283 


AY401283 


Homo sapi 




2 


1783 


95. 


7 


3186 
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BC036783 


BC036783 


Homo sapi 




3 


1739.4 


93. 


4 


1788 


29 


AY401284 


AY401284 


Pan trogl 
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1544.4 


82. 


9 


1788 


29 


AY401285 


AY401285 


Mus muscu 




5 


1521 
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6 


2534 


11 


AK044636 


AK044636 


Mus muscu 




6 


971 


52. 


1 


1589 


11 


CNSLT1IBJ 
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human ful 
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899. 6 


48. 
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941 


13 


BX374548 


BX374548 


BX374548 
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12 
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BI913344 


603178823 
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784 . 8 
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AY398961 


AY398961 


Homo sapi 
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41. 
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BX347210 


BX347210 
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Mus muscu 
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AL286344 


Tetraodon 




23 


503.8 


27 . 


0 


588 


14 


CF533347 


CF533347 


UI-M-FY0- 
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RESULT 1 
AY401283 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 

FEATURES 

source 



AY401283 1788 bp DNA linear GSS 15-DEC-2003 

Homo sapiens SLC8A3 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY401283 

AY401283.1 GI: 39757272 
GSS. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 1788) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Ke j ariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J . J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 
Clark, A. G. , 
Todd, M. A. , 
Ferriera, S 



gene 



to 1788) 

Glanowski, S . , Nielson,R., Thomas, P., Kejariwal,A. 
Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
, Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 



Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 

1. .1788 

/organism="Homo sapiens" 
/mol_type= 11 genomic DNA" 
/db_xref="taxon:9606" 
<1. ->1788 
/gene= M SLC8A3 " 
/locus_tag="HCM0839" 



ORIGIN 



Query Match 95.8%; Score 1784.4; DB 29; Length 1788; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1785; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 



Qy 

Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 



121 ACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTG 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 ACAGGGCAGAACAATGAGTCCTGTT CAGGGT CAT CGGACT GCAAGGAGGGT GTCATCCTG 180 

181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

2 41 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I 1 1 I 1 1 1 1 I 1 1 I I I 1 1 1 1 1 I I I 1 1 1 I I I I 1 1 I I I I I 1 1 I I I I I I I I I I I i I I I I I I I I 1 1 

241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

301 T CT AT T GAAGT CAT CACCT CT CAAGAGAG GGAGGT GACAAT T AAGAAAC C CAAT G GAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 T CT AT T GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT TAAGAAACC CAAT G GAGAA 360 

361 ACCAGCACAACCACTATT CGGGT CT GGAAT GAAACT GT CT C CAAC CT GACC CTTAT GGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I t I I I I I I I I 

361 ACCAGCACAAC CAC TAT T C GGGT CT GGAAT GAAACT GT CT C CAAC CT GAC C CTTAT GGCC 420 

421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 48 0 

481 ATT G CT GGT GAT CT G GGAC CTT CT AC CAT T GT AGGGAGT GC AG C CT T C AACAT GT T CAT C 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 ATT G CT GGT GAT CT G GGAC CTT CT AC CATT GT AGGGAGT GCAGC CTT CAACATGT TCAT C 54 0 

541 ATCATT GGCAT CTGT GTCTACGT GAT CCCAGACGGAGAGACTCGCAAGAT CAAGCAT CTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

541 ATCAT T GGCAT CTGT GT CT AC GT GAT C C CAGAC GGAGAGAC TC GCAAGAT CAAGCAT CTA 600 

601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 72 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 72 0 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

781 AT G C AC AAAAAGT AC C G C AC AGACAAACAC C GAG GAAT TAT C AT AG AGAC AGAG GGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

781 ATGCACAAAAAGT ACCGCACAGACAAACACCGAGGAATTAT CATAGAGACAGAGGGT GAC 840 

8 41 CACC CTAAGGGCATTGAGAT GGAT GGGAAAAT GAT GAATT CCCATTT T CTAGAT GGGAAC 900 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

841 CAC C CTAAG GGCAT T GAGAT GGAT G GGAAAAT GAT GAATT C CC AT TT T CTAGAT G GGAAC 900 

901 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTCTC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

901 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTCTC 960 



Qy 961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGATGGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGGAT CT GAAGCAAAAAC ACC C AGAGAAGGAC T TAGAT CAGC T GGT GGAGAT GGC CAAT 1020 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

Qy 1081 AT GAT G ACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAG CAGAACAAGC CAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1140 

Qy 1141 T C C AG CAT GAG C GAG G T G C A C AC C GAT GAG C C T GAG G AC T T TAT T T C C AA G GTCTTCTTT 1200 

I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

Qy 1261 AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GT GGACTACAAAACAGAGGAT GGTTCTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I . 
Db 1261 AAAGG G GGAGAC AT GT CAAAGAC CAT GTAT GT GGACTACAAAACAGAGGAT GGT T C T GC C 1320 

Qy 1321 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 AAT GC AGGGG CT GACT AT GAGTT CAC AGAGGG C ACGGT G GTT CT GAAGC CAGGAGAGAC C 1380 

Qy 1381 CAGAAGGAGTTCTCCGTGGGCATAATTGATGACGACATTTTTGAGGAGGATGAACACTTC 1440 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGAAGGAGTTCT CCGTGGGCATAATT GAT GACGACATTTTTGAGGAGGATGAACACTT C 144 0 

Qy 1441 TT T GT AAGGT T GAGCAAT GT CCGCAT AGAGGAG GAG CAGC CAGAGGAGGGGAT GCCT CCA 1500 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

Qy 1561 GT T AC CAT CT T G GAT GAT GAC CAT G C AGGC AT CTT C ACTT TT GAAT GT GAT AC TAT T CAT 1620 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 GT T AC CAT CT T G GAT GAT GAC CAT G C AGGCAT CTT C ACTT TT GAAT GT GATACT AT T CAT 1620 

Qy 1621 GT CAGT GAGAGT ATT GGT GTTATGGAGGT CAAGGTTCT GC GGACAT CAGGT GCC CGGGGT 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I 

Db 1681 AC AGT CAT CGTCCCCTT TAG GACAGT AGAAGGGACAGCCAAGGGT G GCG GT GAGGACTT T 1740 

Qy 1741 GAAGAC AC AT AT G GG G AGT T G GAAT T C AAGAAT GAT GAAACT GTAT 17 8 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 GAAGAC AC AT AT GGGGAGT T GGAATT CAAGAAT GAT GAAACT GT GT 17 86 



RESULT 2 
BC036783 
LOCUS 

DEFINITION 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 
TITLE 
JOURNAL 



REMARK 
COMMENT 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



BC036783 3186 bp mRNA linear HTC 19-NOV-2003 

Homo sapiens solute carrier family 8 (sodium- calcium exchanger) , 
member 3, mRNA (cDNA clone IMAGE : 5732743 ) , with apparent retained 
intron. 
BC036783 

BC036783. 1 GI : 23331089 
HTC. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 

1 (bases 1 to 3186) 

Strausberg, R. L. , Feingold, E. A. , Grouse, L.H., Derge,J.G., 
Klausner, R. D. , Collins , F. S . , Wagner, L., Shenmen, CM., Schuler, G. D. , 
Altschul, S . F. , Zeeberg,B., Buetow,K.H., Schaef er , C . F . , Bhat,N.K., 
Hopkins, R. F. , Jordan, H., Moore, T., Max,S.I., Wang, J., Hsieh,F., 
Diatchenko, L. , Marusina,K., Farmer, A. A., Rubin, G.M., Hong,L., 
Stapleton,M. , Soares,M.B., Bonaldo,M. F. , Casavant , T . L . , 
Scheetz, T . E. , Browns tein,M. J. , Usdin,T.B., Toshiyuki, S . , 
Carninci,P., Prange,C, Raha,S.S., Loquellano, N . A. , Peters , G. J. , 
Abramson, R. D. , Mullahy, S . J. , Bosak, S . A. , McEwan, P. J. , 
McKernan, K. J. , Malek,J.A., Gunaratne, P . H . , Richards, S., 
Worley,K.C, Hale,S., Garcia, A.M., Gay,L.J., Hulyk,S.W., 
Villalon, D. K. , Muzny,D.M., Sodergren, E . J. , Lu,X., Gibbs,R.A., 
Fahey,J., Helton, E., Ketteman,M., Madan,A., Rodrigues , S . , 
Sanchez, A. , Whiting, M. , Madan,A. , Young, A. C, Shevchenko, Y . , 
Bouf f ard, G. G. , Blakesley, R. W. , Touchman, J. W. , Green, E.D., 
Dickson, M. C. , Rodriguez , A. C . , Grimwood, J., Schmutz,J., Myers, R.M., 
Butterf ield, Y. S . , Krzywinski, M. I . , Skalska,U., Smailus , D . E . , 
Schnerch,A., Schein,J.E., Jones, S.J. and Marra,M.A. 
Generation and initial analysis of more than 15,000 full-length 
human and mouse cDNA sequences 

Proc. Natl. Acad. Sci. U.S.A. 99 (26), 16899-16903 (2002) 

22388257 

12477932 

2 (bases 1 to 3186) 
Strausberg, R. 
Direct Submission 

Submitted (23-AUG-2002 ) National Institutes of Health, Mammalian 
Gene Collection (MGC) , Cancer Genomics Office, National Cancer 
Institute, 31 Center Drive, Room 11A03, Bethesda, MD 20892-2590, 
USA 

NIH-MGC Project URL: http://mgc.nci.nih.gov 
Contact: MGC help desk 
Email: cgapbs-r@mail.nih.gov 
Tissue Procurement: Invitrogen 

cDNA Library Preparation: Life Technologies, Inc. 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: National Institutes of Health Intramural 

Sequencing Center (NISC) , 

Gaithersburg, Maryland; 

Web site: http://www.nisc.nih.gov/ 

Contact: nisc_mgc@nhgri.nih.gov 

Akhter,N., Ayele,K., Beckstrom-Sternberg, S .M. , Benjamin, B., 
Blakesley, R.W. , Bouf f ard, G. G. , Breen,K., Brinkley,C, Brooks, S., 



Dietrich, N. L. , Granite, S., Guan,X., Gupta, J., Haghighi,P., 
Hansen, N., Ho,S.-L., Karlins,E., Kwong,P., Laric,P., Legaspi,R., 
Maduro, Q. L. , Masiello, C. , Maskeri, B. , Mastrian, S . D. ,McCloskey, J. C . , 
McDowell, J., Pearson, R. , Stantripop, S . , Thomas , P . J. , Touchman, J. W . , 
Tsurgeon,C., Vogt,J.L., Walker, M. A., Wetherby, K. D . , Wiggins, L., 
Young, A., Zhang, L.-H. and Green, E.D. 

Clone distribution: MGC clone distribution information can be found 
through the I.M.A.G.E. Consortium/LLNL at: http://image.llnl.gov 
Series: IRAK Plate: 79 Row: j Column: 21 

This clone was selected for full length sequencing because it 
passed the following selection criteria: matched mRNA gi : 17865803 
This clone has the following problem: retained intron. 
FEATURES Location/Qualifiers 
source 1. .3186 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon: 9606" 

/clone="IMAGE: 5732743" 

/tissue_type="Brain, hippocampus 11 

/clone_lib="NIH_MGC_124" 

/lab_host="DH10B" 

/note="Vector: pCMV-SP0RT6" 

ORIGIN 

Query Match 95.7%; Score 1783; DB 11; Length 3186; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 1812; Conservative 0; Mismatches 25; Indels 4; Gaps 1; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I II I I I I I I I I I I I I I I I I I 

Db 558 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 617 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 618 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 677 

Qy 121 ACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 67 8 ACAG GGCAGAACAAT GAGT C CT GT T CAGGGT CAT CGGACT GCAAGGAGGGT GT CAT C CTG 737 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 738 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAG 797 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 98 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 857 

Qy 301 T CT ATT GAAGT CAT C AC CT CT CAAGAGAGG GAG GT GACAAT TAAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 858 T CT ATT GAAGT CAT CAC CT CT C AAGAGAG GGAGGT GACAAT TAAGAAACC CAAT GGAGAA 917 

Qy 361 AC C AGCACAAC C ACT AT TCGGGTCTG GAAT GAAACT GT CT C CAAC CT GAC C CT T AT GGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 918 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 977 



Qy 

Db 



421 
978 



480 
1037 



Qy 481 AT T G CT GGT GAT CT GGGAC CT T CT AC CAT T GT AGGGAGT GCAGC CT T CAACAT GTT C AT C 540 

I I I I I I I I I I I I I I I I I I I I I I LI I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1038 AT T GCT GGT GAT CT GG GAC CTT CTAC CAT T GT AGGGAGT GCAGC CT T CAACAT GTT CAT C 1097 

Qy 541 AT CAT T GGCAT CT GT GT CTAC GT GAT C C CAGAC GGAGAGAC T C G CAAGAT C AAGC AT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 1098 AT CATT GGCAT CT GT GT CTAC GT GAT C CCAGAC GGAGAGAC T C G CAAGAT CAAGCAT CTA 1157 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I i I I I I I I I II I I I I I . 

Db 1158 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1217 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1218 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1277 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 127 8 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1337 

Qy 781 ATGCACAAAAAGT ACCGCACAGACAAACACCGAGGAATTAT CATAGAGACAGAGGGT GAC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1338 AT G C ACAAAAAGT AC C GCAC AGAC AAACAC C GAG GAAT TAT CAT AG AG AC AGAG GGT GAC 1397 

Qy 841 CAC CCTAAGGGC AT T GAGAT GGAT GG GAAAAT GAT GAATT CC C ATT T T CT AGAT GGGAAC 900 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1398 CAC C CT AAG G GC AT T GAGAT GGAT GG GAAAAT GAT GAAT T C C CAT T T T CT AGAT GGGAAC 1457 

Qy 901 CTGGTGCCCCTG GAAGG GAAG GAAGT GGAT GAGT CC C GC AGAGAGAT GAT CC GGAT T CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1458 CT GGT GC CC CTG GAAGGGAAGGAAGT GGAT GAGT CCC GC AGAGAGAT GAT CC GGAT T CT C 1517 

Qy 961 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACT TAGAT C AGCT GGT GGAGAT G GC CAAT 1020 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1518 AAGGAT CTGAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCT GGT GGAGAT GGC CAAT 1577 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 157 8 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1637 

Qy 1081 AT GATGACT GGT GCAGGCAATAT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 114 0 

I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1638 AT GATGACT GGT GCAGGCAATATCCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1697 

Qy 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1698 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1757 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1758 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1817 

Qy 1261 AAAGGGGGAGAC AT GT CAAAGAC CAT GT AT GT G GACT ACAAAACAGAGGAT G GTT CT GC C 1320 



Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I U I I I I I I I I I I I 

1818 AAAGGGGGAGACAT GT CAAAGACCAT GTAT GTGGACTACAAAACAGAGGAT GGTT CT GCC 



1877 



1380 



1321 AAT GCAG GGGCT GACT AT GAGTT C ACAGAG G GCAC GGT GGT T CT GAAGCC AGGAGAGAC C 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1878 AAT GCAGGGGCTGACTAT GAGTT CACAGAGGGCACGGT GGT TCT GAAGCCAGGAGAGACC 1937 

1381 C AG AAG GAG TTCTCCGTGGG CAT AAT T GAT G AC G AC AT T T T T GAG GAG GAT G AAC AC T T C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1938 C AG AAG G AGT TCTCCGTGGG CAT AAT T GAT G AC G AC AT T T T T GAG GAG GAT GAAC AC T T C 1997 

1441 TTT GT AAG GT T GAGCAAT GT C C GC AT AGAGGAGGAG C AGC CAGAGGAGGGGAT G C CT C CA 1500 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I 
1998 T TT GT AAG GT T GAGCAAT GT CCGC AT AGAGGAGGAGC AGC CAGAGGAGGGGAT GC CT C CA 2057 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
2058 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 2117 

1561 GTTACCAT CTT GGAT GAT GACCAT GCAGGCATCTT CACTTTTGAATGT GATACTATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2118 GTTACCAT CTT GGAT GAT GACCAT GCAGGCATCTT CACTTTTGAATGT GATACTATTCAT 2177 

1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I 
2178 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 2237 

1681 AC AGT CAT C GT CC C CTT T AGGAC AGTAGAAGGGACAG C CAAGG GT GGC GGT GAGGACT TT 174 0 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2238 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 2297 

1741 GAAGACACAT AT GGGGAGTT GGAATTCAAGAAT GAT GAAACT GTAT GT GACAGACAGGAA 1800 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

22 98 GAAGACACAT AT GGGGAGTT GGAATTCAAGAAT GAT GAAAC T GT GAAAAC CAT AAG 2353 

1801 GCT GACT AT GGAAGAAGAGGAGGC CAAGAG GAT AG C AGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 

2354 GGTTAAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGA 2394 
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AY401284 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 
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AY401284 1788 bp DNA linear GSS 15-DEC-2003 

Pan troglodytes SLC8A3 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY4 012 84 

AY401284.1 GI: 39757273 
GSS. 

Pan troglodytes (chimpanzee) 
Pan troglodytes 
Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 1788) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Ke j ariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 



Craniata; Vertebrata; Euteleostomi; 
Catarrhini; Hominidae; Pan. 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 

FEATURES 

source 



gene 



Inferring nonneutral evolution from human- chimp -mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 1788) 

Clark,A.G., Glanowski, S . , Nielson,R., Thomas, P., Ke j ariwal , A. , 
Todd, M. A., Tanenbaurn,D.M. , Civello, D . R. , Lu,F., Murphy, B . , 
Ferriera,S., Wang,G., Zheng, X.H., White, T . J. , Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2 003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 

1. .1788 

/organism="Pan troglodytes " 

/mol_type=" genomic DNA" 

/db_xref="taxon: 9598" 

<1. .>1788 

/gene="SLC8A3" 

/locus tag="HCM0839" 



ORIGIN 



Query Match 93.4%; Score 1739.4; DB 29; Length 1788; 

Best Local Similarity 97.8%; Pred. No. 0; 

Matches 174 6; Conservative 0; Mismatches 40; Indels 0; Gaps 



0; 



Qy 

Db 



ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 



Qy 

Db 

Qy 

Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

61 TTTGTGCTCTTTCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

121 ACAGGGCAGAACAAT GAGT C CT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GT C AT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

121 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GTCAT CCT G 180 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



181 C CAAT CT GGTAC CC GGAGAAC C CTT CCCT TG GGGACAAGAT T GC CAGG GT CAT T GT CT AT 240 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

181 C CAAT CT GGTAC CC GGAGAACC CTT CCCTT GGGGACAAGAT T GC C AGG GT CAT T GT CT AT 240 

241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCG 300 

301 T CT AT T GAAGT CAT C ACCT CT CAAGAGAGGGAGGT GACAATT AAGAAACC CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 T CT AT T GAAGT CAT C AC CT CT CAAGAGAGGGAGGT GAC GATT AAGAAAC C CAAT GGAGAA 360 

3 61 AC CAGC AC AAC C ACT AT TCGGGTCTG GAAT GAAACT GT CT C C AAC CT GAC C CT T AT GGC C 420 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

361 ACCAGCACAACCACTATTCGAGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 



Qy 



421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 



Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 4 81 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

Qy 541 AT CAT T G G CAT C T G T GT C T AC GT GAT C C C AG AC G GAG AGAC T C G C AAG AT C AAG CAT C T A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 541 AT CATT GGCAT CT GT GT CT AC GT GAT C C CAGAC GGAGAGACT C GCAAGATCAAGCACCT A 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I 

Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 AT G C ACAAAAAGT AC C GC ACAGAC AAAC AC C GAG GAAT TAT C AT AG AG ACAGAG G GT GAC 84 0 

I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 ATGCACAAAAAGTACCGCACAGATAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 840 

Qy 841 CACCCTAAGGGCATTGAGATGGATGGGAAAATGATGAATTCCCATTTTCTAGATGGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 CAC CCT AAGGGC ATT GAGAT GGAT GG GAAAAT GAT GAAT T CC CAT TT T CT AGAT GGGAAC 900 

Qy 901 CT GGT GCC C CT GGAAGGGAAGGAAGT GGAT GAGT CC CGC AGAGAGAT GAT CCGGAT T CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTCTC 960 

Qy 961 AAGGAT CT GAAG CAAAAAC ACC CAGAGAAGGACTT AGAT CAGCT G GT GGAGAT GG C CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I III 
Db 961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGATGGCTAAT 1020 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGGATCCAAGCCACTCGT 1080 

Qy 1081 AT GAT GACT GGT GCAGGCAATAT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 AT GAT GACT GGT GCAGGCAATAT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

Qy 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 TCCAGCATGANNGAGGTGCACACCGATGANNCTGAGGACTTTATTTCCAAGGTCTTCTTT 12 00 

Qy 1201 GAC CCAT GT T CTT AC CAGT GCCT GGAGAACT GT GGGGCT GTACT CCT GACAGTGGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 GAC CCAT GT T CT T AC CAAT GCCT GGAGAACT GT GGG GCT GTACT CCT GACAGT GGT GAGG 1260 



Qy 1261 AAAGGG GGAGACAT GT C AAAGAC CAT GT AT GT GGACT ACAAAACAGAGGAT GGTT CT GC C 1320 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I III 



Db 1261 AAAGGGGGAGACAT GT CAAAGACCAT GTAT GT GGACTACAAAACAGAGGATGGTNNNGCC 1320 

Qy 1321 AAT GC AGG GGCT G ACT AT GAGT T C AC AGAGGGCAC GGT G GT T CT GAAG C CAG GAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 AAT GC AGGGG CT GACT ATGAGT T CAC AGAG GG CAC G GT GGTT CT GAAGC C AGGAGAGAC C 1380 

Qy 1381 CAGAAGGAGTTCT CCGTGGGCATAATT GAT GACGACATTTTT GAGGAGGATGAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I II I I I I I I I II II I I I I I I I I I I 
Db 1381 CAGAAGGAGT T CT C C GTAG GCAT AAT TNNN GAC GAC ATT TNNNAGGAGGAT GAACAC TTN 1440 

Qy 1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 NNNNNAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGNCTCCA 1500 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1501 GCAATANNCAACAGTNNNNCCTTGCCTCGGGCTGTNNTAGCCTCCCCTTGTGTNGCCACA 1560 

Qy 1561 GTTACCATCTTGGATGATGACCATGCAGGCATCTTCACTTTTGAATGTGATACTATTCAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GTTACCATCTTGGATGATGACCATGCAGGCATCTTCACTTTTGAATGTGATACTATTCAT 1620 

Qy 1621 GT CAGT GAGAGT AT T GGT GT TAT GGAGGT CAAG GTT CT GC GGAC AT CAGGT GC C CGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 168 0 

Qy 1681 AC AGT CAT C GT CC CCT TTAGGAC AGT AGAAG GGACAGCCAAGGGT GGCGGT GAGGACTTT 174 0 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 174 0 

Qy 17 41 GAAGAC ACAT AT G GGGAGT T GGAATT C AAGAAT GAT GAAACT GT AT 1786 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 GAAGACACATATGGGGAGTT GGAATTCAAGAAT GATGAAACTGT GT 1786 



RESULT 4 
AY401285 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 



AY401285 1788 bp DNA linear GSS 15-DEC-2003 

Mus musculus SLC8A3 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY401285 

AY401285.1 GI:39757274 
GSS. 

Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 

1 (bases 1 to 1788) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Ke j ariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 1788) 



AUTHORS 



TITLE 
JOURNAL 

COMMENT 

FEATURES 

source 



gene 



Clark,A.G., Glanowski, S . , Nielson,R., Thomas, P. , Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J . J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 

1. .1788 

/organism="Mus musculus" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 10090" 
<1. .>1788 
/gene="SLC8A3" 
/locus_tag="HCM0839" 



ORIGIN 



Query Match 82.9%; Score 1544.4; DB 29; Length 1788; 

Best Local Similarity 91.5%; Pred. No. 0; 

Matches 1635; Conservative 0; Mismatches 151; Indels 0; Gaps 



0; 



Qy 

Db 



ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
ATGGCGTGGTTACGGCTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACT 60 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I II 
61 TTTGTGCTCTTCCTGAATTGTCTTCGAGCAGAGGCTGGTGACTCGGGGGATGTGCCCAGT 12 0 

121 ACAGGGCAGAACAAT GAGT CCT GTTCAG GGT CAT C GGACT GCAAGGAG GGT GT CAT C CT G 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
121 G CAGGGC AGAACAAT GAGT CCTGTTCGGGGT CAT CAGACT GCAAGGAGG GT GT CAT T T T G 18 0 

181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 CCAATCTGGTATCCAGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 TTTGTGGCCCTGATATACATGTTTCTTGGGGTGTCTATCATTGCTGACCGATTCATGGCA 300 

301 T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT T AAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
301 T CTATT GAAGTCAT T ACT T C C CAAGAGAGGGAAGT GAC CAT CAAGAAGC C CAAT GGAGAG 360 

361 AC C AGCACAAC C ACT AT T C GG GT CT GGAAT GAAACT GT CT C C AAC CT GAC C CT T AT G GC C 420 

II I I I I I I I I I I I I II I I I I I I I I I II I 

361 AC C AGCACAACT ACAAT T CGG GT ATGGAAT GAAACT GT CT C CAAT CT GAC C CT GAT GGC C 42 0 

421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 CTGGGCTCTTCTGCTCCAGAGATTCTCCTGTCTTTAATTGAGGTGTGTGGTCACGGGTTC 480 



Qy 



481 



ATT GCT GGT GAT CT GGGAC CTT CT AC CAT T GT AGG GAGT GC AGC CTT CAAC AT GT T CAT C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I II I I I I I I I I I I I I I I I I I I I I I 



540 



Db 4 81 ATTGCTGGTGATCTGGGACCATCTACCATCGTTGGCAGTGCAGCCTTCAACATGTTCATC 540 

Qy 541 AT CAT T G GC AT CT GT GT CT AC GT GAT C C C AGAC GGAGAGAC T C GCAAGAT C AAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II 
Db 541 AT CAT T GG CAT CT GT GT CT AT GT GAT C C C AGAT GG G GAGACT C GAAAGAT CAAG C AC CT G 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I M I I II I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CGAGTCTTCTTCGTCACGGCTGCTTGGAGCATCTTCGCCTACATTTGGCTCTATATGATC 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CTGGCAGTCTTCTCTCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTTACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 7 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 TTTCCCGTGTGTGTCCTGCTGGCTTGGGTGGCAGATAAGCGACTGCTCTTCTACAAATAC 7 80 

Qy 7 81 AT G C AC AAAAAG T AC C G C AC AG AC AAAC AC C GAG G AAT TAT CAT AG AG AC AG AG G GT G AC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 AT G C AC AAAAAAT AC C G C AC AG AT AAAC AC C GAG G AAT TAT CAT T GAG AC AG AG G GT G AC 8 40 

Qy 841 CACCCTAAGGGCATT GAGATGGATGGGAAAAT GATGAATT CCCATTTTCTAGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I II 
Db 841 CACCCTAAGGGCATTGAGATGGATGGGAAAATGATGAATTCTCACTTTCTAGATGGGAAC 900 

Qy 901 CT G GT GC C C CT G GAAGGGAAG GAAGT G GAT GAGT C C C GCAGAGAGAT GATC CGGATT CT C 960 

I II I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 901 TTTACACCTTT GGAAGGAAAGGAGGTAGATGAAT CT CGCAGGGAAAT GAT CCGGATTCTA 960 

Qy 961 AAGGAT CT GAAGCAAAAAC ACC CAGAGAAGGACT T AGATC AGCT GGT GGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 961 AAGGAT CT GAAACAAAAAC AC C CAGAAAAGGAC CT AGATC AGCT G GT GGAGAT GGCCAAT 1020 

Qy 1021 T ACT AT GCT CT T T C C C AC C AAC AGAAGAGC C G C GC CT T CT AC C GTAT C CAAGC C ACT C GT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I II 
Db 1021 TACT AT GCTCTTTCC CAT CAAC AGAAGAGC CGT GCT T TCT AC C GCAT C CAAGC C AC C C GG 108 0 

Qy 1081 AT GAT GACTGGT GCAGGCAATATCCT GAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I II I I I I I I I II 
Db 1081 AT GAT GACT GGT GCGG GCAATATACT TAAGAAGC AT GCAGC C GAGCAAGC CAAGAAGAC C 1140 

Qy 1141 T C CAG CAT GAGC GAGGTGC ACAC CGAT GAGC CT GAG GACT T TAT T TC CAAGGT CT T CT T T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II 
Db 1141 T C CAG CAT GAGC GAGGTGC AT AC CGAT GAGC CGGAG GACT TT G C CTCTAAGGT CT T CT T T 1200 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1201 GACC C AT GT T CTT AT CAGT G CCT GGAGAACT GT GGAGCTGT CCT C CT GAC C GT GGT GAGG 1260 

Qy 1261 AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GT GGACT ACAAAAC AGAGGAT GGTTCTGCC 1320 

I I I I I I I I I I I II II I I I I I I I I I I I I I I I I II I I I I I I I I I I I II II II III 
Db 1261 AAAGGGGGAGAT ATAT CCAAGAC CAT GT AC GT G GACT ACAAAAC AGAGGAC GGCT CCGC C 1320 

Qy 1321 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 AATGCAGGGGCAGACTAT GAGTT CACAGAGGGCACT GTGGTTCTGAAGCCAGGAGAGACC 1380 



Qy 

Db 



1381 
1381 



1440. 
1440 



Qy 1441 TT T GT AAGGT T GAGCAAT GT C C GCAT AGAGGAG GAGC AG C CAGAGGAGGGGAT GC CT C CA 1500 

I I I I I III I I I I I I II I I I I I I I I I I I I II I I I I I I II I I I I I I I I I III 

Db 14 41 TTTGTGAGGCTGAGCAATGTCCGTGTAGAAGAGGAGCAGCTGGCGGAGGGGATGCTCCCA 1500 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

MINI I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I 
Db 1501 GCAATACTCAATAGTCTTCCTTTGCCTCGGGCTGTCCTGGCCTCCCCTTGTGTGGCCACA 1560 

Qy 1561 GT T AC CAT CT T GGAT GAT GAC CAT GC AG GCAT CT T C ACT T T T GAAT GT GAT ACT AT T CAT 1620 

II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 1561 GT AAC CAT CT T GGAT GAT GAC CAT GC AGGAAT T T T C ACTT TT GAAT GT GAT AC CATT C AT 1620 

Qy 1621 GT C AGT GAGAGT ATT G GT GT TAT GGAGGT CAAGGT T C T GC GGAC AT CAGGT GC C C G GGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I II I I 
Db 1621 GT CAGT GAAAGTAT T G GT GTT AT GGAAGTC AAG GT TT T GAGGAC AT CAGGT GC CAGGG GC 1680 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1681 ACAGT C AT CGT CC CTT T TAGGAC AGTAGAAG GGACAG C CAAGGGT GGT GGC GAGGACT TT 1740 

Qy 17 41 GAAGAC AC AT AT GG G GAGT T G GAAT T C AAGAAT GAT GAAACT GT AT 1786 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1741 GAAGAT GCAT ATGGGGAGCT GGAGT T CAAGAAT GAT GAAACAGT GT 1786 
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REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
MEDLINE 
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Craniata; Vertebrata; Euteleostomi ; 
Sciurognathi; Muridae; Murinae; Mus . 



AK044636 2534 bp mRNA linear HTC 20-SEP-2003 

Mus musculus adult retina cDNA, RIKEN full-length enriched library, 
clone :A930029A02 product : solute carrier family 8 ( sodium/ calcium 
exchanger), member 3, full insert sequence. 
AK044636 

AK044636.1 GI: 26336660 
HTC; CAP trapper. 
Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Rodentia; 
1 

Carninci,P. and Hayashizaki, Y. 

High-efficiency full-length cDNA cloning 

Meth. Enzymol. 303, 19-44 (1999) 

99279253 

10349636 

2 

Carninci,P., Shibata,Y., Hayatsu,N., Sugahara,Y., Shibata,K., 

Itoh,M., Konno,H., Okazaki,Y., Muramatsu,M. and Hayashizaki, Y . 

Normalization and subtraction of cap-trapper-selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new genes 

Genome Res. 10 (10), 1617-1630 (2000) 

20499374 

11042159 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 

TITLE 
JOURNAL 
REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 



COMMENT 



FEATURES 



Shibata,K., Itoh,M., Aizawa,K., Nagaoka,S., Sasaki, N., Carninci , P . , 
Konno,H., Akiyama,J., Nishi,K., Kitsunai,T., Tashiro,H., Itoh,M., 
Sumi,N., Ishii,Y., Nakamura,S., Hazama,M., Nishine,T., Harada,A., 
Yamamoto, R. , Matsumoto, H . , Sakaguchi , S . , Ikegami,T., Kashiwagi, K. , 
Fujiwake,S., Inoue,K., Togawa,Y. f Izawa,M w Ohara,E., Watahiki,M. , 
Yoneda,Y., Ishikawa,T., Ozawa,K w Tanaka,T., Matsuura,S., Kawai,J., 
Okazaki,Y., Muramatsu,M. , Inoue,Y., Kira,A. and Hayashizaki, Y. 
RIKEN integrated sequence analysis (RISA) system — 384-format 
sequencing pipeline with 384 multicapillary sequencer 
Genome Res. 10 (11), 1757-1771 (2000) 
20530913 
11076861 
4 

The RIKEN Genome Exploration Research Group Phase II Team and the 
FANTOM Consortium. 

Functional annotation of a full-length mouse cDNA collection 

Nature 409, 685-690 (2001) 

5 

The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

Analysis of the mouse transcriptome based on functional annotation 
of 60,770 full-length cDNAs 
Nature 420, 563-573 (2002) 
6 (bases 1 to 2534) 

Adachi,J., Aizawa,K., Akimura,T., Arakawa,T., Bono,H., Carninci, P., 
Fukuda,S., Furuno,M., Hanagaki,T., Hara,A., Hashizume, W. , 
Hayashida, K. , Hayatsu,N., Hiramoto,K., Hiraoka,T., Hirozane,T., 
Hori,F., Imotani,K., Ishii,Y., Itoh,M. , Kagawa,I., Kasukawa,T., 
Katoh,H., Kawai,J., Kojima,Y., Kondo,S., Konno,H., Kouda,M., 
Koya,S., Kurihara,C, Matsuyama, T . , Miyazaki,A., Murata,M., 
Nakamura,M., Nishi,K., Nomura, K., Numazaki,R., Ohno,M., Ohsato,N., 
Okazaki,Y., Saito,R., Saitoh, H . , Sakai,C, Sakai,K., Sakazume,N., 
Sano,H., Sasaki, D., Shibata,K., Shinagawa,A. , Shiraki,T., 
Sogabe,Y., Tagami,M. , Tagawa,A., Takahashi, F . , Takaku-Akahira, S . , 
Takeda,Y., Tanaka,T., Tomaru,A. , Toya,T., Yasunishi, A. , 
Muramatsu,M. and Hayashizaki, Y. 
Direct Submission 

Submitted ( 16- JUL-2001 ) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN) , Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama, 
Kanagawa 230-0045, Japan (E-mail : genome-res@gsc. riken.go. jp, 
URL:http: //genome . gsc . riken . go . jp/ , Tel: 81-45-503-9222, 
Fax:81-45-503-9216) 

cDNA library was prepared and sequenced in Mouse Genome 
Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. 

Retina RNA was provided by Dr. Stefano Gustincich (Department of 
Neurobiology, Harvard Medical School, 220 Longwood Ave., Boston, MA 
02115, USA) whose assistance is gratefully acknowledged. Please 
visit our web site for further details. 
URL: http : //genome . gsc . riken. go . jp/ 
URL: http : / /fan torn. gsc . riken. go . jp/ . 
Location/Qualifiers 



source 1. .2534 

/organism="Mus musculus" 
/mol_type="mRNA" 
/strain="C57BL/6J" 
/ db_x r e f = " FANTOM_D B : A9 3 0 0 2 9 AO 2 " 
/db_xref="MGI: 2409963" 
/db_xref="taxon: 10090" 
/clone="A93002 9A02" 
/tissue_type=" retina" 

/clone_lib="RIKEN full-length enriched mouse cDNA library" 
/dev_stage="adult" 
CDS 713. .>2533 

/ no te=" unnamed protein product; putative 

solute carrier family 8 (sodium/ calcium exchanger) , member 

3 (MGD | MGI : 107976, GB | NM_0 80440, evidence: BLASTN, 99%, 

match=2394)" 

/codon_start=l 

/protein_id="BAC32013 . 1" 

/db_xref="GI: 26336661" 

/ trans la tion="MCPVQGRTMSPVRGHQTARRVS FCQLWYPENPSLGDKIARVTVY 
E^ALIYMFLGVSIIADRETy[ASIEVITSQEREWIKKPNGETSTTTIRVWNETVSNLTL 
MALGSSAPEILLSLIEVCGHGFIAGDLGPSTIVGSAAFNMFIIIGICVYVIPDGETRK 
I KHLRVFFVTAAWS I FAYIWLYMI LAVFS PGWQVWEGLLTLFFFPVCVLLAWVADKR 
LLFYKYMHKKYRTDKHRGI I I ETEGDHPKGI EMDGKMMNSHFLDGNFTPLEGKEVDES 
RREMIRILKDLKQKHPEKDLDQLVEMANYYALSHQQKSRAFYRIQATRMMTGAGNILK 
KHAAEQAKKTSSMSEVHTDEPEDFASKVFFDPCSYQCLENCGAVLLTWRKGGDISKT 
MYVDYKTEDGSANAGADYEFTEGTWLKPGETQKEFSVGIIDDDIFEEDEHFFVRLSN 
VRVE E EQLAE GML P AI LN S L P L P RAVLAS P CVAT VT I L D DD HAG IFTFECDTI HVS E S 
IGVMEVKVLRTSGARGTVIVPFRTVEGTAKGGGEDFEDAYGELEFKNDETVKTIRVKI 
VDEEEYERQENFFIALGEPKWMERGISGVRFFLNQSNSQER" 

ORIGIN 

Query Match 81.6%; Score 1521; DB 11; Length 2534; 

Best Local Similarity 90.2%; Pred. No. 0; 

Matches 1662; Conservative 0; Mismatches 175; Indels 6; Gaps 3; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGG-CTGGTTAC 59 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 603 ATGGCGTGGTTACGGCTGCACCCTCTCACCTCTGCCTTCCTCCATCTTGGGCCTGGTTAC 662 

Qy 60 CTTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAG 119 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I II 
Db 663 TTTTGTGCTCTTCCTGAATTGTCTTCGAGCAGAGGCTGGTGACTCGGGGGATGTGCCCAG 722 

Qy 120 CACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCT 179 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ill I 

Db 72 3 TGCAGGGCAGAACAATGAGTCCTGTTCGGGGTCATCAGACTGCAAGGAGGGTGTCATTTT 782 

Qy 18 0 GCCAA-TCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCT 238 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 78 3 G C CAACT CT GGT AT C CAGAGAACC CT T C C CTT GGGGACAAGAT T GC CAGGGT CAT T GT CT 842 

Qy 239 ATTTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGG 2 98 

I 1 I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 843 AT TT T GT GGC C CT GATAT ACAT GT T T CT T GGGGT GT CT AT CAT T G CT GACC GATT CAT GG 902 



Qy 



299 



CAT CT AT T GAAGT CAT C AC CT CT CAAGAGAGGGAGGTGACAAT T AAGAAAC C CAAT GGAG 



358 



903 CAT CT AT T GAAGT CAT TACTT C C CAAGAGAG GGAAGT GAC CAT CAAGAAGC C CAAT GGAG 962 

359 AAAC C AG C AC AAC C AC TAT TCGGGTCTG GAAT G AAAC T G T C T C C AAC C T GAC C CT TAT G G 418 

I I I I I I I I II I I II I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
963 AGACCAGCACAACTACAATT CGGGTATGGAATGAAACT GT CTCCAAT CTGACCCTGAT GG 1022 

419 CCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGT 478 

I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

1023 CCCTGGGCTCTTCTGCTCCAGAGATTCTCCTGTCTTTAATTGAGGTGTGTGGTCACGGGT 1082 

479 TCATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCA 538 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I 

1083 T CAT T G CT G GT GAT CT GGGAC CAT CT ACCAT C GT T GG CAGT GC AGCC T T CAACAT GT T CA 1142 

539 T CAT CAT T G GCAT CT GT GT CT AC GT GAT CC CAGACGGAGAGACT CGC AAGAT CAAGC ATC 598 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I 
1143 T CAT CAT T GGCAT CT GT GT CT AT GT GAT C C CAGAT GG GGAGACT CGAAAGAT CAAGC AC C 1202 

599 TACGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGA 658 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1203 TGCGAGTCTTCTTCGTCACGGCTGCTTGGAGCATCTTCGCCTACATTTGGCTCTATATGA 1262 

659 TTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCT 718 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

12 63 TCCTGGCAGTCTTCTCTCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTTACTCTCTTCT 1322 

719 TCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAAT 778 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1323 TCTTTCCCGTGTGTGTCCTGCTGGCTTGGGTGGCAGATAAGCGACTGCTCTTCTACAAAT 1382 

779 ACATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTG 838 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1383 AC AT GCACAAAAAAT AC CGC ACAGAT AAACAC C GAGGAAT TAT CAT T GAGACAGAGGGT G 1442 

839 ACC AC CCT AAGGG CAT T GAGAT GGAT GGGAAAAT GAT GAAT T C C CAT T TT CT AGAT GGGA 898 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
1443 AC C AC C CTAAGGGCAT T GAGAT G GAT GGGAAAAT GAT GAAT T CT CACT TT CT AGAT GGGA 1502 

8 99 ACCTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTC 958 
III II I I I I I II I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1503 ACT T T AC AC CT TT GGAAGGAAAGGAGGT AGAT GAAT CT C GCAGGGAAAT GAT C C GGAT T C 1562 

959 TCAAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCT GGT GGAGAT GGCCA 1018 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I 
1563 T AAAG GAT CT GAAACAAAAACACC CAGAAAAGGACCT AGAT CAGCT GGT GGAGAT GGCCA 1622 

1019 ATTACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTC 107 8 

I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

1623 ATTACTATGCTCTTTCCCATCAACAGAAGAGCCGTGCTTTCTACCGCATCCAAGCCACCC 1682 

1079 GTAT GAT GACT GGT GCAGG CAAT AT C CT GAAGAAACAT GC AGC AGAACAAGC CAAGAAGG 1138 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I 
1683 GGAT GAT GACT GGT GC GGG CAAT AT ACTT AAGAAGCAT G C AGC C GAG CAAGC CAAGAAGA 1742 



1139 C CT C CAGCAT GAGC GAGGT GCACACC GAT GAGC CT GAGGACTT TATT T C CAAG GT CT T CT 1198 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 



Db 1743 C C T C CAGC AT GAGC GAGGT GC AT AC C GAT GAGC C GGAGGACT T T G C CT CT AAGGT CTT CT 18 02 

Qy 1199 TTGACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGA 1258 

I I I I I I I I I II I I I I I II I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1803 T T GAC C CAT GTT CTT AT C AGT G C CT GGAGAACT GT GGAGCT GT CCT CCT GAC C GT G GT GA 1862 

Qy 1259 GGAAAGGGGGAGACAT GT CAAAGAC CAT GTAT GT GGACT ACAAAACAGAGGAT GGT T CT G 1318 

I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I 
Db 1863 G GAAAGGGGGAGAT ATAT C CAAGAC CAT GT AC GT GGACT ACAAAACAGAGGAC GG CT C C G 1922 

Qy 1319 CCAAT GCAGGGGCT GACT AT GAGTT CACAGAGGGCAC GGT GGTTCT GAAGCCAGGAGAGA 1378 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1923 CCAAT GCAGGGGCAGACTATGAGTT CACAGAGGGCACT GTGGTTCT GAAGCCAGGAGAGA 1982 

Qy 1379 CC CAGAAGGAGTTCT CCGTGGGCATAATT GAT GACGACATTT TTGAGGAGGAT GAACACT 1438 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1983 CC CAGAAGGAGTTCT CTGT GGGCAT CATT GAT GAT GACATTTTTGAGGAGGAT GAACACT 2 042 

Qy 1439 TCTTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTC 14 98 

I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2043 T CTTT GTGAGGCTGAGCAATGT CCGT GTAGAAGAGGAGCAGCT GGC GGAGGGGAT GCT CC 2102 

Qy 14 99 CAGCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCA 1558 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I 

Db 2103 CAGCAATACTCAATAGTCTTCCTTTGCCTCGGGCTGTCCTGGCCTCCCCTTGTGTGGCCA 2162 

Qy 1559 C AGT T AC CAT CT T G GAT GAT GAC CAT GC AGGC AT CT T C ACT T T T GAAT GT GAT ACT AT T C 1618 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I 
Db 2163 C AGT AAC CAT C T T GGAT GAT GAC CAT GCAG GAAT T T T C ACTT T T GAAT GT GAT AC CAT T C 2222 

Qy 1619 AT GT CAGT GAGAGT ATT GGT GT T AT GGAG GT CAAGGTT CT G C GGACAT CAGGT GC C CGG G 1678 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I III 
Db 2223 AT GT CAGT GAAAGT ATT G GT GT TAT GGAAGT CAAG GTT T T GAGGACAT CAGGT GC CAG GG 2282 

Qy 167 9 GT AC AGT CAT C GT C C CCT TTAG GAC AGT AGAAGG GACAGCCAAGGGTGGCGGT GAGGACT 1738 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 2283 GCACAGT CAT CGTCCCTTT T AGGACAGT AGAAGGGACAGCCAAGGGT GGT G GCGAGGACT 2342 

Qy 1739 T T GAAGACAC AT AT G GGGAGT T GGAAT T C AAGAAT GAT GAAACT GTAT GT GAC AGAC AG G 1798 

II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II 

Db 2343 TTGAAGAT GCATAT GGGGAGCTGGAGTT CAAGAAT GAT GAAAC AGT GAAAAC CAT A 2398 

Qy 17 99 AAGCT GACT AT GGAAGAAGAG GAGGCCAAGAG GAT AG C AGAGA 1841 

I I I I I I I I I I I I I I I II I II I I I I I 

Db 2399 AGG GT T AAAAT AGT AGAT GAGGAG GAGT AC GAGAGG C AAGAGA 2 441 
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CNSLT1IBJ 

LOCUS 

DEFINITION 

ACCESSION 
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KEYWORDS 
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CNSLT1IBJ 1589 bp mRNA linear HTC 18-JUN-2003 

human full-length cDNA 5-PRIME end of clone CS0DB006YD18 of 
Neuroblastoma of Homo sapiens (human) . 
BX248763 

BX2 487 63. 1 GI : 28375580 
HTC. 

Homo sapiens (human) 
Homo sapiens 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
REMARK 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 



COMMENT 



FEATURES 

source 



CDS 



Centre National de Sequencage : 
(E-mail : seqref@genoscope.cns.fr 



Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 1589) 

Li,W.B., Gruber,C, Jessee, J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished 

Contact : Feng Liang Email : fliang@lifetech.com URL : 
http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue 

2 (bases 1 to 1589) 
Genoscope . 
Direct Submission 

Submitted ( 13-FEB-2003 ) Genoscope 
BP 191 91006 EVRY cedex - FRANCE 
- Web : www.genoscope.cns.fr) 

1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with ,Not I and cloned 
into the Not I and Eco RV sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. 

Location/Qualifiers 

1. .1589 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="CS0DB006YD18" 
/tissue_type="Neuroblastoma " 

/note="end : 5-PRIME~Cot 10-normalized~vector pCMVSP0RT_6" 
619. .>1589 

/note="unnamed protein product" 
/codon_start=l 
/protein_id="CAD66570.1" 
/db_xref="GI : 28375581" 

/translation="MAWLRLQPLTSAFLHFGLVTFVLFLNGLRAEAGGSGDVPSTGQN 
NESCSGSSDCKEGVILPIWYPENPSLGDKIARVIVYFVALIYMFLGVSIIADRFMASI 
EVITSQEREWIKKPNGETSTTTIRWNETVSNLTLMALGSSAPEILLSLIEVCGHGF 
I AGDLGP STI VGSAAFNMFI I IGI CVYVT PDGETRKI KHLRVFFI TAAWSI FAYIWLY 
MI LAVFS PGWQWEGLLTLFFFPVC VIjLAWVADKRLL FYKYMHKKYRTDKHRGI HE 
TEGDHPKGIEMDGKMMNSHFLDGNLVPLEGKEVDESRREMIRILKDL" 



ORIGIN 



Query Match 52.1%; Score 971; DB 11; Length 1589; 

Best Local Similarity 100.0%; Pred. No. 2.7e-274; 

Matches 971; Conservative 0; Mismatches 0; Indels 0; 



Gaps 



0; 



Qy 



Db 



1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

619 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 678 



Qy 



Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I | | | | | | I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

679 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 738 



Qy 

Db 



121 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGT CAT CGGACT GCAAGGAGGGT GT CAT CCT G 180 

I | | I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
739 ACAGGG CAGAACAAT GAGT C CT GT TCAGGGT CAT C G GACT GCAAGGAGGGT GT CAT C CT G 798 



Qy 


181 


C CAAT CT GGT ACCC GGAGAAC CCTTCCCTT GG GGAC AAGAT T GC CAGGGT CATT GT C TAT 


240 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 > 1 




Db 


Ton 

/ y y 


bbAAl b 1 bbl AbbbbbAbAAbbb 1 1 LLL 1 1 {jIjKdKdI \L- AAo A 1 1 kj\^\_/vcrv^rij± w\± 1 oi 


O J o 


Qy 


241 


TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 


300 




1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


o c o 

859 


TTTGTGGCCCTGA1A1 AbAl bl Ibbl 1 bbbbl bl bbAl LAI IbblbAbbbbl lbA±<cr^L>v 


Q1 ft 

Z? X o 


Qy 


301 


T CTATTGAAGT CAT CAC CT CT CAAGAGAGGGAGGT G AC AAT T AAG AAAC C CAAT GGAGAA 


360 




1 | | | | M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 M 




Db 


919 


TCTATTGAAG I LAI bAbb Ibl bAAbAbAbbbAbb 1 bAbAAl 1 AAbAAAbbbAAl bbAbAA 


y i O 


Qy 


361 


ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 


420 




I I I 1 I I I 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


979 


ACCAGCACAACCACTA1 I LbbbI bl bbAAl bAAAbl bl bl bbAAbbl bAbbbl 1A1 bbbb 




Qy 


421 


CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 


480 




1 I 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


1039 


CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTT1AA1 1 bAbbl bl bl bbl bAl bbbl lb 


iuyo 


Qy 


481 


ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 


540 




1 II 1 1 1 1 1 1 M | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1099 


ATTGCTGGTGATCTGGGACCTTCTAbbAi 1 bl AbbbAbl bbAbbbl 1 bAAbAl bl 1 bAl b 


1 IDo 


Qy 


541 


AT CATT G GC AT CT GT GT C TAC GT GAT C C CAGAC GGAGAGACTC GCAAGAT CAAGCAT CT A 


600 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1159 


ATCATTGGCATCTGTGTCTACGTGATCCCAGACGGAGAGACTCGbAAbAl bAAbbAl bl A 


1Z10 


Qy 


601 


CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 


660 




I I I I I 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 




Db 


1219 


CGAGTCTTCTTCATCACCGC1 bbl lbbAbiAlbi 1 1 bbb 1 AbAlbl bbbl blAlAl bAl 1 


J-Z / o 


Qy 


661 


CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 


720 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1279 


CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGbl 1 IbbbAAbbbblbblbAblblbl Ibl ib 


i ^ ^ ft 

loo o 


Qy 


721 


TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 


780 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


1339 


TTTCCAGTGTGTGTCCTTCTGGbbl bbblbbbAbAl AAAbbAbl bb Ibl 1 bl AbAAAl Ab 


1 ^ Qft 


Qy 


781 


ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 


840 




I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1399 


ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAAl TAi bAl AbAbAbAbAbbb 1 bAb 


J. 1 D O 


Qy 


841 


CAC CCT AAGGGC AT TGAGAT GGAT G GGAAAAT GAT GAAT T CC CATT T T CT AGAT GGGAAC 


900 




II | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 




Db 


14 oy 


bAbbb 1 AAbbbbAl 1 bAbAl bbAl bbbAAAAl bAl oAAi 1 UtLnl 1 1 1 ^ inoAl oovjrtrt^ 


1518 


Qy 


y ui 


r , n*m r vrr , r'r'C' r vnr*~h ArrrAArrzi ar'Trr'ZiTP AC^VCCCCC AnAnAf^ATf^ATPPnf^ATTCTC 
bl bbl bbbbbl bbAAbbbAAbbAAo 1 bbnl onbl k^^\^^v^i-vkj/\kj/\vji-\.J. onl ^v>uuni J. ^ J. 


960 




|| | | | I I I I I 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 M II 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 




Db 


1519 


CT GGT GCCCCTGGAAGGGAAGGAAGT GGAT GAGTCCCGCAGAGAGATGAT CCGGATT CT C 


1578 


Qy 


961 


AAGGAT CT GAA 971 




Db 


1579 


1 1 1 1 1 1 1 1 1 1 1 

AAG GAT CT GAA 1589 





RESULT 7 
BX374548 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



Chordata; Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



BX374548 941 bp mRNA linear EST 08-MAY-2003 

BX374548 Homo sapiens NEUROBLASTOMA COT 10-NORMALIZED Homo sapiens 
cDNA clone CS0DB006YD18 5-PRIME, mRNA sequence. 
BX374548 

BX374548.1 GI:30438490 
EST. 

Homo sapiens (human) 
Homo sapiens 
Eukaryota; Metazoa 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 941) 

Li,W.B., Gruber,C, Jessee, J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies , a division of 
Invitrogen. This sequence belongs to sequence cluster 7256. r For 
more information about this cluster, see 
http : //www. genoscope . ens . f r/ 

cgi-bin/cluster. cgi?seq=CS0DB006DB09_DBl287_2&cluster=7256.r. 
Contact : Feng Liang Email : fliang@lifetech.com URL : 
http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CS0DB006DB09_DB1287_2 . 

Location/Qualifiers 

1. .941 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/ clone- " CS ODBO 0 6YD1 8 " 

/ tissue_type= "NEUROBLASTOMA COT 10 -NORMALIZED" 
/clone_lib="Homo sapiens NEUROBLASTOMA COT 10-NORMALIZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



ORIGIN 



Query Match 4 8.3%; 

Best Local Similarity 97.7%; 
Matches 919; Conservative 



Score 899.6; DB 13; 
Pred. No. 2.2e-253; 
0; Mismatches 21; 



Length 941; 



Indels 



1; Gaps 



1; 



Qy 



Db 



Qy 



Db 



685 GTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCC 74 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1 GGCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCC-GTGTGTGTCCTTCTGGCC 59 

745 T GGGT GGCAGATAAACGACT GCT CTT CT ACAAATACAT GCACAAAAAGT ACCGCACAGAC 804 
I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

60 TGGGT GGCAGATAAACGACT GCT CTT CT ACAAATACAT GCACAAAAAGT ACCGCACAGAC 119 



Qy 

Db 



805 AAACAC C GAGGAATTAT CAT AGAGACAGAGGGT GAC CAC C CT AAGGGCAT T G AGAT GGAT 
II I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
120 AAACAC C GAGGAATTAT CAT AGAGACAGAGGGT GAC CAC CCT AAGGGCAT TGAGAT GGAT 



864 
179 



Qy 865 GGGAAAATGAT GAATT CCCATTTT CT AGATGGGAACCTGGT GCC CCT GGAAGGGAAGGAA 924 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 180 G G G AAAAT GAT G AAT T C C CAT T T T C T AG AT G G G AAC CTGGTGCCCCTG G AA G G G AAG G AA 239 

Qy 925 GT G GAT G AGT C C C G C AG AG AG AT GAT C C G GAT T C T C AAG GAT C T GAAG C AAAAAC AC C C A 984 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 240 GT GGAT GAGT CCC GCAGAGAGAT GAT C CGGATT CT CAAG GAT CT GAAGCAAAAAC AC C CA 299 

Qy 985 GAGAAGGACT T AGAT C AGCT GGT G GAGAT GGC CAAT T ACT AT GCTCT TT C C CAC CAACAG 1044 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 300 GAGAAGGACT T AGAT C AGCT G GT G GAGAT GG CCAAT T ACT ATG CTCTTT C C CAC CAACAG 359 

Qy 1045 AAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGTATGATGACTGGTGCAGGCAATATC 1104 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 360 AAGAGC C GCGC CT T CT ACCGT AT C CAAGC C ACT C GT AT GAT GACT GGT GC AGGCAAT AT C 419 

Qy 1105 CTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCCT C CAGCAT GAGCGAGGT GCACACC 1164 

II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 420 CTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCCTCCAGCATGAGCGAGGTGCACACC 479 

Qy 1165 GATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTACCAGTGCCTG 1224 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 480 GATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTACCAGTGCCTG 539 

Qy 1225 GAGAACT GT GGGGCT GTACT CCT GACAGTGGTGAGGAAAGGGGGAGACAT GT CAAAGACC 1284 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 540 GAGAACT GT GGGGC T GTACT C CT GAC AGT GGT GAGGAAAGGGGGAGACAT GT CAAAGAC C 599 

Qy 1285 AT GT AT GT GG ACT ACAAAACAGAG GAT GGT T CT GCCAAT GCAGGGGCT GACT AT GAGTT C 1344 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 600 ATGTAT GT G GACT ACAAAACAGAGGAT GGT T CT GC CAAT G CAG GGG CTGACT AT GAGT T C 659 

Qy 1345 AC AGAG GGC AC G GT GGT T CT GAAGC C AGGAGAGAC C C AGAAGGAGT T CT C C GT GG GC AT A 1404 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 660 ACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACCCAGAAGGAGTTCTCCGTGGGCATA 719 

Qy 1405 ATT GAT GACGACATTTTTGAGGAGGAT GAACACTTCTTT GTAAGGTT GAGCAAT GTCCGC 1464 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 720 ATT GAT GACGACATTTTTGAGGAGGAT GAACACTTCTTT GNTAGGTT GAGCAAT GTCCGC 77 9 

Qy 1465 AT AGAG GAG GAGCAGC C AGAGGAG GGGAT GC CT CCAGCAAT AT T CAACAGT CTTCCCTTG 1524 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 780 AT AGAG GAG GAG C AGC CAGAGGAGG G GAT G C CTNN CAGCAT AT T CAAAC AGT CT T C CTT G 839 

Qy 1525 CCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGATGACCAT 1584 

I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 84 0 CCTCGGGCTGTCCTAGCCTNCCCTTGNGTGGNCACAGTTACCATCTTGGATGATGACCAT 899 

Qy 1585 GC AGGC AT CTT C ACT T T T GAAT GT GAT ACT AT T CAT GT CAG 1625 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 900 GCNAGCAT CTT CACTTTT GAAT GT GATACTATT CAT GTCAG 940 



RESULT 8 
BI913344 

LOCUS BI913344 



887 bp mRNA linear EST 16-OCT-2001 



DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



603178823F1 NIH_MGC_121 Homo sapiens cDNA clone IMAGE: 5243308 5 f , 

mRNA sequence. 

BI913344 

BI913344.1 GI:16177710 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 887) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 

Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: Life Technologies, Inc. 

cDNA Library Preparation: Life Technologies, Inc. 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: Incyte Genomics, Inc. 

Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: 
http : / /image . llnl . gov 
Plate: LLAM11613 row: m column: 05 
High quality sequence stop: 782. 

Location/Qualifiers 

1. .887 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon: 9606" 

/clone=" IMAGE: 5243308" 

/lab_host="DH10B" 

/ clone_lib="NIH_MGC_12 1 " 

/note="0rgan: brain; Vector: pCMV-SP0RT6; Site_l: NotI; 
Site_2 : EcoRV (destroyed); RNA source anonymous pool of 3 
fetal brains, female age 20 weeks, female age 24 weeks, 
and male age 26 weeks. Library is oligo-dT primed and 
directionally cloned (EcoRV site is destroyed upon 
cloning). Average insert size 1.7 kb, insert size range 
0.7-3.5 kb. Library is normalized and enriched for 
full-length clones and was constructed by C. Gruber 
(Invitrogen) . Research Genetics tracking code 017. Note: 
this is a NIH_MGC Library." 



ORIGIN 



Query Match 43.2%; Score 805; DB 12; Length 887; 

Best Local Similarity 98.0%; Pred. No. 1.8e-225; 

Matches 8 36; Conservative 0; Mismatches 15; Indels 2; Gaps 



2; 



Qy 



Db 



916 GGGAAGGAAGTGGAT GAGT CCCGCAGAGAGAT GAT CCGGATT CT CAAGGAT CTGAAGCAA 975 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I 

1 GGGAAGGAAGTGGAT GAGTCCCGCAGAGAGAT GAT CCGGATT CT CAAGGATCTGAAGCAA 60 



Qy 



Db 



976 AAACAC C CAGAGAAG GACTTAGAT C AGCT GGT GGAGAT GGC CAAT T ACTAT GCT CT TT C C 1035 

I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I ! I I I I I I I I I II I I I I I I I I I I I I I I I 

61 AAACAC C C AGAGAAGGACTT AGAT C AGCT G GT GGAGAT G GC CAAT TACTAT GCTCTTTCC 120 



Qy 1036 C AC C AAC AGAAGAG CCGCGCCTT CT AC C GT AT C C AAG C C AC T CGT AT GAT G ACT G GT G C A 1095 



Db 


121 


CAC CAACAGAAGAGC C GC GC CTT CT AC C GT AT C CAAG C CACT C GT AT GAT GACT GGT G C A 180 


Qy 


1096 


GG CAAT AT C C T GAAGAAAC AT GCAGC AGAACAAG CCAAGAAGGCCT C CAGC AT GAG C GAG 


1155 






i i i i i i j i i i i i i i i i i i i i i i i i i i i i i i t t t i i i i i i i i i i i i i i i i i i ) i i i i i i i i 
1 II 1 II i 1 M II II 1 M 1 M M M 1 II 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 




Db 


181 


ubUAAJ. Al CC I GAAGAAACATGCAGCAGAACAAGCCAAGAAGGCCTCCAGCATGAGCGAG 


240 


Qy 


1156 


GTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTAC 


1215 






i t i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 




Db 


241 


G I GCACACC GAT GAGC CT GAGGACTT T AT T T C C AAGGT CT T CT TT GAC C CAT GT T CT TAC 


300 


Qy 


1216 


C AGT GC C T GGAGAAC TGTGGGGCT GT AC T C CT GAC AGT GGT GAG GAAAGG GGGAGAC AT G 


1275 






i i t i i i i i i i i i i i i i i i i i i i i i i ■ i i i ■ i i i i i i i i i ■ i i ■ ■ ■ ■ , 

1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II I I I I I I I I I I | | | 




Db 


301 


CAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGGAAAGGGGGAGACATG 


360 


Qy 


1276 


T CAAAGACCAT GT AT GT GGACT ACAAAACAGAGGAT GGTT CT GC CAAT GC AGG GGCT GAC 


1335 






1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 ( l l i l l l i i i i i i i i i i i i i i i i i i i i i i i i i i i i t i i i i > i 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 | | | | || | | | | | | 




Db 


361 


T CAAAGACCAT GT AT GT GGACT ACAAAACAGAGGAT GGTT CT GCCAATGCAGGGGCT GAC 


420 


Qy 


1336 


TAT GAGT TCACAGAGGGCAC G GT GGTT CTGAAG C CAG GAGAGAC C CAGAAGGAGT T CT CC 


1395 






1 | t 1 1 | | t 1 1 1 1 1 f 1 1 1 1 1 1 1 i 1 1 1 I t 1 | | 1 | J | 1 ft J 1 ■ ■ ! ft 

M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


421 


TAT GAGT T CACAGAGGG CAC GGT G GTT CT GAAGC CAGGAGAGAC C CAGAAG GAGT TCT CC 


480 


Qy 


1396 


GTGGG C AT AAT T GAT GAC GAC AT T T T T GAG GAG GAT G AAC AC T T C T T T GT AAG GT T GAG C 


1455 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 II | | | | | | | | | | 




Db 


481 


GTGGGCATAATTGAT GAC GACATTTTT GAGGAGGATGAACACTT CTTTGTAAGGTTGAGC 


540 


Qy 


1456 


AAT GT CC GCATAGAGGAGGAG CAGC CAGAGGAGG GGAT GC CT CCAGC AAT AT TCAACAGT 


1515 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


541 


AAT GT C C GCAT AGAGGAG GAGCAG C CAGAG GAGGGGAT GCCT CC AGCAAT AT T CAAC AGT 


600 


Qy 


1516 


CTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGAT 


1575 






I 1 1 \ | 1 f t 1 III lllllllllll IlllllllllllllJilllllllitlliiiii « 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I | 




Db 


601 


CTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGAT 


660 


Qy 


1576 


GAT GAC C AT GC AGG C AT CTTC ACT TTT GAAT GT GAT ACT AT T CAT GT CAGT GAGAGT ATT 


1635 






i i i i i i i i i i i i i ■ i i i i i i i i i i i i ■ i i i i i i i i i > i ■ ■ ■ i iitiiiii ■ 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


661 


GAT GAC CAT GC AGGCAT CTT CACT T TT GAAT GTGATACTAT T CAT GT CAGT GAGAGT A- T 


719 


Qy 


1636 


GGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGTCATCGTCCCC 


1695 






INN 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


720 


GGTGTAATGGAGGTCAAGGTTCTGCGGACATCATGTGCCCGGGGTACAGTCATCGTCCCC 


779 


Qy 


1696 


T TT - AGGACAGT AGAAGGGACAGC CAAGG GT GGC GGT GAGGACTTT GAAGAC AC AT AT GG 


1754 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 




Db 


780 


TTT C AGGACAGGAGAAGG GAC AGC CAAGGCT G CAC GCT AAGGACT T GAAGAC CCAT AT GC 


839 


Qy 


1755 


GGAGTT GGAAT T C 1767 




Db 


840 


1 1 1 1 1 1 1 1 1 1 1 1 1 

G GAGT T GGAAT T C 852 





RESULT 9 
AY398961 

LOCUS AY398961 2922 bp DNA linear GSS 15-DEC-2003 

DEFINITION Homo sapiens SLC8A1 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 

FEATURES 

source 



gene 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



AY398961 

AY398961. 1 GI: 39754950 
GSS. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 

1 (bases 1 to 2922) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Ke j ariwal, A. , 
Todd, M. A., Tanenbaum,D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T . J. , Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 
Clark, A. G. , 
Todd, M. A. , 
Ferriera, S 



to 2922) 

Glanowski, S . , Nielson,R., Thomas, P., Kejariwal,A. 
Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
, Wang,G., Zheng, X.H., White, T . J. , Sninsky, J. J . , 



ORIGIN 



Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 

1. .2922 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 9606" 
<1. .>2922 
/gene="SLC8Al" 
/locus_tag="HCM0065" 



Query Match 42.1%; 
Best Local Similarity 68.3%; 
Matches 1165; Conservative 



Score 784.8; DB 29; 
Pred. No. 3.8e-219; 
0; Mismatches 502; 



Length 2922; 
Indels 39; Gaps 



4; 



Qy 



Db 



109 GAC GT GC CAAGCAC AGG G CAGAAC AAT GAGT C CT GTTCAGG GT C AT C G GACT GCAAGGAG 168 

M II II I II I I I I I II I I I I I I I I I I I I I I I I 

112 GAAATGGAAGGAGAAGGAAAT GAAACT GGT GAAT GTACTGGATCAT ATTACT GT AAGAAA 171 



Qy 

Db 

Qy 

Db 

Qy 

Db 



169 GGTGTCATCCTGCCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGG 228 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
172 GGGGTGATTTTGCCCATTTGGGAACCCCAAGACCCTTCTTTTGGGGACAAAATTGCTAGA 231 



229 



288 



GT CAT TGT CT AT TTT GT G G CC CT GAT AT ACAT GT T C CT T GG GGT GT C CAT C ATT GCTGAC 
I I Ml I I I I I I I I I I I I II I I I I I I I I I I I I I I II II I I I I I I I I I I 
232 GCTACTGTGTATTTTGTGGCCATGGTCTACATGTTTCTTGGAGTCTCTATCATAGCTGAT 291 

28 9 C GCTT CAT GGC AT CT ATT GAAGT CAT CACCT CT CAAGAGAGGGAG GT GACAAT T AAGAAA 348 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I II I I I I I I I I I I I 
292 C GGT T CAT GT C CT CTAT AGAAGT CAT CACAT CT C AAGAAAAAGAAATAACC ATAAAGAAA 351 



Qy 



349 C C CAAT G GAGAAACCAGCACAACCACT AT T C GGGT CTGGAAT GAAACT GT CT C CAAC CT G 4 08 



Db 352 C C CAAT G GAGAGAC CAC CAAGAC AACT GT GAGGAT CT GGAAT GAAACAGT T T CTAAC CT G 411 

Qy 409 ACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGT 468 

I M I I I I I I I I I I I I II II I I I I I I I II I I I Mill II I I I II I I I I I I I I 

Db 412 ACCTTGATGGCCCTGGGATCTTCTGCTCCTGAGATTCTCCTTTCAGTAATTGAAGTGTGT 471 

Qy 4 69 GGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTC 528 

M Ml I I I I III II II II II II I I I I I I II II I I I I I II III 
Db 472 GGCCATAACTTCACTGCAGGAGACCTCGGTCCTAGCACCATCGTGGGAAGTGCTGCATTC 531 

Qy 529 AACAT GT T CAT CAT CAT T GGCAT CT GT GT CT AC GT GAT C C CAGAC G GAGAGAC T CG CAAG 588 

II I I I I I I I I I I I I I I I I I I I I I I II III I II I I I I I I I I I I I I III 

Db 532 AAT AT GT T CAT CAT TAT T GC ACT CT GT GTT T AT GT GGTG C CT GACGGAGAGACAAGGAAG 591 

Qy 589 ATCAAGCATCTACGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGG 648 

II I I I I I I I II I I I II I II I II II II I I I I I I I I I I I I I I I I I I I I I I 

Db 592 ATTAAGCATTTGCGTGTCTTCTTTGTGACAGCAGCCTGGAGCATCTTTGCCTACACCTGG 651 

Qy 649 CTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTC 708 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I III 
Db 652 CTTTACATTATTTTGTCTGTCATATCTCCTGGTGTTGTGGAGGTCTGGGAAGGTTTGCTT 711 

Qy 7 09 ACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTC 768 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 712 ACTTTCTTCTTCTTTCCCATCTGTGTTGTGTTCGCTTGGGTAGCGGATAGGAGACTTCTG 771 

Qy 769 TTCTACAAATACATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAG 82 8 

I I I I I I I I I I MM I ill II I I I I I I I I II I I I I I I I I 
Db 772 TTTTACAAGT ATGT CTACAAGAGGTATCGAGCT GGCAAGCAGAGGGGGAT GATTATT GAA 831 

Qy 829 AC AG AG G GT GAC CAC C C T AAG G GC ATT GAGAT GGAT GGGAAAAT GAT GAAT 879 

I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I 

Db 8 32 CAT GAAGGAGACAGGC CAT C T TCT AAGACT GAAAT T GAAAT GGAC GGGAAAGT G GT CAAT 891 

Qy 8 80 TCCCATTTTCTAGATGGGAACCTGGTGCCCCTGGAAGGGAAG 921 

I I I I I I I I I I I I I I I I III 

Db 8 92 T CT CAT GT T GAAAAT TT CTT AGAT GGTGCTCTGGTTCT GGAGGT G GAT GAGAGGGAC CAA 951 

Qy 922 GAAGT GGAT GAGT C CCGC AGAGAGAT GAT C C GGAT TCT CAAGGAT CT GAAGCAAAAACAC 981 

III I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 952 GATGATGAAGAAGCTAGGCGAGAAATGGCTAGGATTCTGAAGGAACTTAAGCAGAAGCAT 1011 

Qy 982 C CAGAGAAGGACT T AGAT CAGCT GGT GGAGAT GGCCAATT ACT AT GCT CTT T CC C AC CAA 1041 

I I I I I I I I I I I I I I I I III I I I I I I I I I I II I I I I 

Db 1012 C CAGATAAAGAAAT AGAG CAAT T AATAGAAT T AGCT AACT ACCAAGT C CTAAGT CAGCAG 1071 

Qy 1042 CAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGTATGATGACTGGTGCAGGCAAT 1101 

M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I 
Db 1072 CAAAAAAGTAGAGCATTTTAT CGCATT CAAGCTACTCGCCTCAT GACT GGAGCTGGCAAC 1131 

Qy 1102 AT C CT GAAGAAACAT G C AGC AGAACAAGCCAAGAAGGC CT C CAGCAT GAGCGAGGT G CAC 1161 

II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1132 ATTTTAAAGAGGCAT GCAGCT GACCAAGCAAGGAAGGCTGT CAGCAT GCACGAGGTCAAC 1191 

Qy 1162 ACCGATGAGCCTG AG GAC T T TAT T T C C AAG GT C T T C T T T GAC C CAT GT T C T T AC C AG 1218 

I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I 



Db 



1192 ACT GAAGTGACT GAAAAT GACC CT GT TAGTAAGAT CT T CT T T GAACAAGGGAC AT AT CAG 1251 



Qy 1219 T G C CTG GAGAACT GT GG GGCT GT ACT C CT GACAGT G GT GAGGAAAGG GGGAGACAT GT CA 1278 

I I I I I I I I I I I I I I I I III! Mill I I I I I I I I I I I III 
Db 1252 TGTCTGGAGAACTGTGGTACTGTGGCCCTTACCATTATCCGCAGAGGTGGTGATTTGACT 1311 

Qy 1279 AAGACCATGTATGTGGACTACAAAACAGAGGATGGTTCTGCCAATGCAGGGGCTGACTAT 1338 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1312 AACACT GT GT TT GT T GACT T CAGAACAGAGGAT G GC ACAG CAAAT GCT GGGT CT GAT TAT 1371 

Qy 1339 GAGTTCACAGAGGGCACGGT GGTT CT GAAGCCAGGAGAGAC CCAGAAGGAGTT CTCCGTG 1398 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I III 

Db 1372 GAAT TTACT GAAGGAACT GT GGT GTT T AAGC CT GGT GAT AC CCAGAAGGAAAT C AGAGT G 1431 

Qy 1399 GGCATAATTGATGACGACATTTTTGAGGAGGATGAACACTTCTTTGTAAGGTTGAGCAAT 1458 

II II II I I I I I II II I I I I I I I I I I I I I I I I III I I I I I MINI 

Db 1432 GGTATCATAGATGATGATAT CTTT GAGGAGGATGAAAATTT CCTTGT GCATCT CAGCAAT 1491 

Qy 14 59 GTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCAGCAATATTCAACAGTCTT 1518 

III II II I I I I I I I I I I I III I I I I I 

Db 1492 GT CAAAGTAT CTT CT GAAGCT T CAGAAGAT GGC ATACT GGAAGC CAATCAT 1542 

Qy 1519 CCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGAT 157 8 

I II III I I I I I I I I I I I I I I I I II I I II I I I I II 

Db 1543 GTTTCTACACTTGCTTGCCTCGGATCTCCCTCCACTGCCACTGTAACTATTTTTGATGAT 1602 

Qy 1579 GACCATGCAGGCATCTT CACTTTT GAAT GT GAT ACTATTCATGTCAGT GAGAGTATT GGT 1638 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1603 GAC CAC G CAG GCAT T TT T ACT TT T GAGGAAC CT GT GACT CAT GT GAGT GAGAGC ATT GGC 1662 

Qy 1639 GTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGTCATCGTCCCCTTT 1698 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1663 AT CAT GGAGGT GAAAGT ATT GAGAAC AT CT GGAGCT C GAGGAAAT GT TAT C GTT C CAT AT 1722 

Qy 1699 AGGACAGT AGAAGG GAC AGC CAAGGGT GGC GGTGAGGACT T T GAAGACACATAT GGGGAG 1758 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 172 3 AAAACCAT CGAAGGGACT GCCAGAGGTGGAGGGGAGGATTTTGAGGACACTTGT GGAGAG 1782 

Qy 1759 T TGGAAT T CAAGAAT GAT GAAACT GT 1784 

I I I I I I I I I I I I I I I I I I I III 
Db 17 83 CT C GAAT T C C AGAAT GAT GAAAT T GT 1808 



RESULT 10 

BX347210 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



BX347210 939 bp mRNA linear EST 05-MAY-2003 

BX347210 Homo sapiens NEUROBLASTOMA COT. 10-NORMALIZED Homo sapiens 
cDNA clone CS0DB006YD18 5-PRIME, mRNA sequence. 
BX347210 

BX347210.1 GI:30381158 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 939) 

Li,W.B., Gruber,C, Jessee, J. and Polayes,D 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



TITLE 
JOURNAL 
COMMENT 



FEATURES 

source 



ORIGIN 



Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref @genoscope . ens . f r, Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies, a division of 
Invitrogen. This sequence belongs to sequence cluster 7256. r For 
more information about this cluster, see 
http : //www. genoscope . ens . f r/ 

cgi-bin/cluster.cgi?seq=CS0BAA004ZB09_CS00355_l&cluster=7256. r. 
Contact : Feng Liang Email : fliang@lifetech.com URL : 
http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CSOBAA004ZB09_CS00355_1 . 

Location/Qualifiers 

1. .939 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon:9606" 
/clone="CS0DB006YD18" 

/tissue J: ype="NEUROBLASTOMA COT 1 0 -NORMALIZED" 
/clone_lib="Homo sapiens NEUROBLASTOMA COT 10-NORMALIZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



Query Match 41.2%; 
Best Local Similarity 95.6%; 
Matches 854; Conservative 



Score 768.2; DB 13; 
Pred. No. 1.4e-214; 
0; Mismatches 33; 



Length 939; 



Indels 



6; Gaps 



6; 



Qy 


105 


Db 


22 


Qy 


165 


Db 


80 


Qy 


225 


Db 


140 


Qy 


285 


Db 


200 


Qy 


345 


Db 


260 


Qy 


405 


Db 


320 



AGGG GAC GT G C CAAGC ACAG G GCAGAACAAT GAGT C CT GT T CAGGGT CAT C GGACTGCAA 164 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II 

AGGGGACGT GCC- AGCACAGGGCAGAACAAT GAGTCCT GTT - AGGGT CAT CGGACTGCAA 7 9 

GGAGGGTGTCATCCTGCCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGC 224 
I I I I I I I I I I I M I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGAGGGTGTCATCCTGCCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGC 139 

CAGGGTCATTGTCTATTTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGC 284 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAGGGT CATTGTCTATTTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGC 199 

T GAC CGCTT C AT GGCAT C T AT TGAAGT CAT C AC CT CT CAAGAGAGGGAGGT GACAAT TAA 344 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
T GAC CGCTT C AT GG CAT CTAT T GAAGT CAT C AC CT CT CAAGAGAGGGAGGT GACAATTAA 259 

GAAACC CAAT GGAGAAAC CAG CACAAC CACT ATT CGGGT CT GGAAT GAAACT GT C T C CAA 404 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | M I I I I I I I I I I I I I I I I 
GAAAC C CAAT GGAGAAAC CAGC ACAAC CACT AT T CGGGTC T GGAAT GAAACTGT CT C CAA 319 

CCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGT 464 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGT 379 



Qy 



465 



GTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGC 524 



~3 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | 

.Db 380 GTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGC 4 39 

Qy 525 CTT CAAC AT GT T CAT CAT CAT T GGC AT C T GT GT CT AC GT GAT C C CAGACGGAGAGACT C G 584 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 44 0 C T T C AAC AT GT T CAT CAT CAT T GG CAT C T GT GT C T AC GT GAT C C C AG AC G GAGAGAC T C G 4 99 

Qy 585 CAAGATCAAGCAT CTACGAGTCTTCTTCATCACC GCT GCTT GGAGTAT CTTT GC CTACAT 644 

I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 500 CAAGATCAAGCAT CTACGAGT CTT CTT CATCACCGCT GCTT GGAGTAT CTTT GCCTACAT 559 

Qy 645 CTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCT 7 04 

I I I I I I I I I I I I I I I I I I I I I I I I'l I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 560 CTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGG-AGGCCT 618 

Qy 705 CCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACT 7 64 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 619 CCTCACTCTCTTCTTC-TTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACT 677 

Qy 765 GCT CT T CT ACAAATACAT GCACAAAAAGTACCGCACAGACAAACACCGAGGAATTAT CAT 824 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III II 
Db 67 8 G C T C T T C T AC AAAT AC AT G C AC AAAAAGT AC C G C AC AG AC AAAC AC C GAG G GAT T TAT AT 737 

Qy 825 AG AG AC AGAG G GT G AC C AC C C T AAG G G CAT T GAG AT G GAT G G G AAAAT GAT G AAT T C C C A 884 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 738 AGAGACAGAG G GT GACCAC CCT AGG GGCT TT GGGAT G GGT G GGAAAAG GAT GAAT T C C CA 7 97 

Qy 885 TTTTCTAGATGGGAACCTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGT-CCCGCAGAG 943 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 798 TTTTCTAGGAGGGAAACCTGTGCCCCCTGAAGGGAAGAAAGTGGATTAATCCCCGCAGAG 857 

Qy 944 AGAT GAT C CG GATT CT C- AAGGAT CT GAAGCAAAAAC AC CC AGAGAAGGACT T 995 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I II I I I 
Db 858 AGAT GAAC CCGGTT CT CT AGGGAT CT GAAAC CAAAAAC CCC C CAAAAAGGC CT 910 



RESULT 11 

AY398963 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
PUBMED 



AY398963 2922 bp DNA linear GSS 15-DEC-2003 

Mus musculus SLC8A1 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY398963 

AY398963.1 GI: 39754952 
GSS. 

Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Rodentia; 
1 (bases 1 to 2922) 

Clark,A.G., Glanowski , S . , Nielson,R., Thomas, P., Ke j ariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J . , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 



Craniata; Vertebrata; Euteleostomi ; 
Sciurognathi; Muridae; Murinae; Mus, 



REFERENCE 2 (bases 1 to 2922) 

AUTHORS Clark, A. G., Glanowski , S . , Nielson,R., Thomas, P., Kejariwal, A. , 
Todd, M. A., Tanenbaum,D.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J . J. , 
Adams, M.D. and Cargill,M. 

TITLE Direct Submission 

JOURNAL Submitted ( 16-NOV-2003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 
COMMENT This sequence was made by sequencing genomic exons and ordering 

them based on alignment. 
FEATURES Location/Qualifiers 
source 1. .2922 

/organism= f, Mus musculus" 
/mol_type="genomic DNA" 
/db_xref="taxon: 10090" 
gene <1. .>2922 

/gene="SLC8Al M 
/locus_tag="HCM0065" 

ORIGIN 

Query Match 40.5%; Score 755; DB 29; Length 2922; 

Best Local Similarity 67.8%; Pred. No. 2.3e-210; 

Matches 1134; Conservative 0; Mismatches 500; Indels 39; Gaps 4; 



Qy 142 T GT T CAGGGT CAT C GGACT GCAAGGAG GGT GT CAT C CT GC CAAT CT G GTAC C C GGAGAAC 201 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II 
Db 145 T GTACTGGCT CATATTACTGTAAGAAAGGGGT GAT CTTGCCCATTT GGGAACCCCAAGAC 204 

Qy 202 CCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTATTTTGTGGCCCTGATATACATG 261 

I > I I I I I I I I I I I I Ill I I I I I I I I I I I M I II I II I 

Db 205 CCAT CTTTT GGGGACAAAATT GCT AGAGCAACT GT GTATTTT GT GGCCATGGT CT ACAT G 264 

Qy 262 TTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCATCTATTGAAGTCATCACCTCT 321 

I I I I I I I I II II II I I I I I I I I I I II III I I I I I I || I I I I I I I I II I I 
Db 265 T T CCT T GGAGTT T CT ATTAT T GCAGAC C GGTT T AT GT CCT CT AT AGAGGT CAT C AC CT CT 324 

Qy 322 CAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAAACCAGCACAACCACT ATT C GG 381 

I I M I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 325 CAAGAGAAAGAAATAACGATAAAGAAACCGAAT GGAGAGACCACCAAGACGACGGT GAGA 384 

Qy 382 GTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAG 441 

I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 385 AT CT GGAAC GAGACT GTGT C GAAC CT GACCTT GAT G GC CCT GGGAT CT T CTGCTCCT GAG 444 

Qy 4 42 ATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCT 501 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 445 ATTCTCCTGTCAGTCATTGAAGTGTGCGGCCATAACTTCACCGCAGGGGACCTGGGTCCC 504 

Qy 502 T CT AC CATT GT AGGGAGT GCAG C CT T CAACAT GT T CAT CAT CATT GGCAT CTGT GT CT AC 561 

I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I III 
Db 505 AGCACCATCGTGGGAAGTGCTGCCTTTAACATGTTCATCATAATCGCACTCTGTGTTTAC 564 

Qy 562 GT GAT CCCAGACGGAGAGACT CGCAAGAT CAAGCAT CTACGAGTCTT CTTCATCACCGCT 621 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 565 GT GGT CC CT GAT G GAGAGACAAGGAAGAT CAAGCAT CTGCGTGTGTTCTTT GT GACAGC A 624 

Qy 622 GCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGT 681 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I II II I 1 1 1 1 1 

Db 625 GCCTGGAGCATCTTTGCCTATACCTGGCTTTATATAATCTTGTCTGTCAGCTCTCCTGGA 684 

Qy 682 GTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTG 741 

I I I I I I I I I I I I I I I I I . I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 685 GTTGTGGAGGTCTGGGAAGGCTTGCTTACTTTCTTCTTCTTTCCCATCTGCGTTGTGTTC 744 

Qy 742 GC CT G G GT GGC AGAT AAAC GACT GCT CTT CT ACAAAT AC AT GCACAAAAAGT AC CGCACA 801 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 745 GCGTGGGTAGCAGACAGGCGGCTTCTCTTTTACAAGTATGTCTACAAGCGGTACAGGGCC 804 

Qy 802 GACAAACAC C GAGGAAT TAT CAT AGAGAC AGAGGGT GAC C AC C C TAAGGGC 852 

I I I I I I I I I I I II I I I I I I I I I I I I II I I 

Db 805 GGCAAGCAGAGGGGGATGAT CATTGAACAT GAAGGAGACAGACCAGCTT CCAAAACT GAA 864 

Qy 853 AT T GAG AT GGAT GGGAAAAT GAT GAAT T C C CAT T T T CT AGAT G GGAAC CTGGTGCCCCTG 912 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 865 AT C GAAAT G GAT GGGAAAGT GGT CAACT CT CAT GT T GACAAT T T CT T AG AT GGGG CT CT G 924 

Qy 913 G AAGGGAAGGAAGT GGAT GAGT CC CGCAGAGAGAT GAT CCGG 954 

I I Ml I II II II I I llllll M 

Db 925 GTTTT GGAAGTT GATGAGAGGGACCAAGAT GAT GAGGAAGCCAGGCGT GAGAT GGCAAGG 984 

Qy 955 ATT CT CAAGGAT C TGAAG CAAAAAC ACCC AGAGAAGGACT T AGAT CAGCTGGT GGAGAT G 1014 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I IN I 

Db 985 AT T CT GAAGGAACTT AAGCAGAAGC AT C CT GAGAAAGAAATT GAGCAAT T AAT AGAATT A 1044 

Qy 1015 GCCAATTACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCC 1074 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1045 GC CAACTAC CAG GT C CT AAGT CAAC AGC AGAAAAGC CGAGCAT TT T AC AGGATT CAAGCT 1104 

Qy 1075 ACT CGT AT GAT GACT GGT G CAG G CAAT AT C CT GAAGAAACAT GCAGCAGAACAAGC C AAG 1134 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1105 ACT C GCCT GAT GAC C G GAGCT GGCAACAT CT T GAAGAGG CAC GC AGCT GAT CAAGCAAGG 1164 

Qy 1135 AAGGCCTCCAGCATGAGCGAGGTGCACACCGATGAGCCTG AGGACTTTATTTCCAAG 1191 

I I I I I llllll I I I I III II I I I I I I I I I Ml 

Db 1165 AAGGCT GT CAGTAT GCAT GAAGT CAAC AT GGAAAT GGCT GAAAAC GAC C CAGT CAGT AAG 1224 

Qy 1192 GTCTTCTTTGACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACA 1251 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill 
Db 1225 AT CTT CTT T GAGCAAGGAACATACCAGT GTCTAGAGAACTGT GGT ACT GTGGCCCT CACC 1284 

Qy 12 52 GT GGT GAGGAAAGGGGGAGACATGT CAAAGACCAT GTAT GT GGACT ACAAAACAGAGGAT 1311 

I I I I I I I I I I I I I I II I II I I I I I I I I II I I I I I I I I I 
Db 1285 AT TAT GC G CAGAGG GGGC GACT T GAGC AC CACT GT GTT T GT T GACT TCAGGACAGAAGAC 1344 

Qy 1312 GGTT CTGCCAAT GCAGGGGCT GACT AT GAGTT CACAGAGGGCACGGT GGTT CTGAAGCCA 1371 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1345 GGC AC AGC CAAT GCT GGGT CT GAT TAT GAAT T CAC GGAAGGGACT GT GAT CT T C AAAC CA 1404 

Qy 1372 GGAGAGAC CCAGAAGGAGTT CT CCGT GGGCAT AATT GAT GACGACATTTTT GAGGAGGAT 1431 

I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1405 GGGGAGACCCAGAAGGAAAT CAGAGTT GGCATCATTGATGAT GAT AT CTTT GAAGAAGAT 14 64 

Qy 1432 GAACACTTCTTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGG 1491 

I I I I I I I I I I I I I I I I II I I I I I I M I I I I I I I I 



Db 



1465 GAAAACTTCCTTGTGCATCTTAGCAATGTCAGAGTCTCTTCAGATGTTTCAGAAGATGGC 1524 



Qy 1492 ATGCCTCCAGCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGT 1551 

II III I I I I I I I III I I I I I I I I 

Db 1525 AT ACTAGAATCCAATCACGCTTCTTCAATTGCTTGTCTTGGGTCACCCAGC 1575 

Qy 1552 GT G G C C AC AGT T AC CAT C T T G GAT GAT G AC CAT G C AG G CAT C T T C AC T T T T G AAT GT GAT 1611 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1576 ACT GC CACC AT AAC C AT TT T T GAT GAT GAC CAT GCAGGC AT CTT T ACAT T T GAGGAACC C 1635 

Qy 1612 ACTATT CATGT CAGTGAGAGTATT GGT GTTATGGAGGT CAAGGTT CT GCGGACATCAGGT 1671 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1636 GT GACT CAC GT GAGCGAGAGCAT T G GCAT CAT GGAGGT GAAGGTTT T GAGAAC CTC T GGA 1695 

Qy 1672 GCCCGGGGTACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGT 1731 

I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I 

Db 1696 GCTCGAGGAAATGTTATCATTCCCTACAAAACTATTGAAGGCACAGCCCGAGGTGGAGGG 1755 

Qy 1732 GAGGACTT T GAAGAC AC AT AT GG GGAGTT GGAAT T CAAGAAT GAT GAAACT GT 1784 

II I I I I I I I I I I I I I I III III I I I I I I I I I I I I I I I I I I II 

Db 1756 GAAGACT TT GAG GAC AC CT GT GGAGAGCT C GAAT T C CAGAAC GAT GAAAT AGT 18 08 



RESULT 12 

BI522813 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



BI522813 792 bp mRNA linear EST 29-AUG-2001 

603175911F1 NIH_MGC_121 Homo sapiens cDNA clone IMAGE : 5240066 5 1 , 
mRNA sequence. 
BI522813 

BI522813.1 GI:15347605 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 792) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: Life Technologies , Inc. 

cDNA Library Preparation: Life Technologies, Inc. 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: Incyte Genomics, Inc. 

Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: 
http : //image . llnl . gov 
Plate: LLAM11605 row: f column: 03 
High quality sequence stop: 778. 
Location/Qualifiers 
1. .792 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon:9606" 
/clone=" IMAGE: 5240066" 
/lab host="DH10B" 



/clone_lib="NIH_MGC_121" 

/note="Organ: brain; Vector: pCMV-SP0RT6; Site_l: NotI; 
Site_2: EcoRV (destroyed); RNA source anonymous pool of 3 
fetal brains, female age 20 weeks, female age 24 weeks, 
and male age 26 weeks. Library is oligo-dT primed and 
directionally cloned (EcoRV site is destroyed upon 
cloning). Average insert size 1.7 kb, insert size range 
0.7-3.5 kb. Library is normalized and enriched for 
full-length clones and was constructed by C. Gruber 
(Invitrogen) . Research Genetics tracking code 017. Note: 
this is a NIH_MGC Library." 

ORIGIN 



Query Match 39.7%; Score 739.8; DB 12; Length 792; 

Best Local Similarity 98.7%; Pred. No. 2.9e-206; 

Matches 7 67; Conservative 0; Mismatches 7; Indels 3; Gaps 2; 



Qy 


993 


CTT AGAT CAG CT GGT GGAGAT GGC CAAT TACT AT G CT C T TT C CC AC CAAC AGAAGAGC C G 


1052 




I I I I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1 


CTTAGAT CAGCT GGT GGAGAT GGCCAATTACTAT GCTCTTT CCCACCAACAGAAGAGCCG 


60 


Qy 


1053 


C GC C TT CT AC C GT AT C C AAG C C ACT C GT AT GAT GACT G GT G C AGGC AAT AT C CT GAAGAA 


1112 


Db 


61 


I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 

C GCCT T CT AC C GT AT CC AAGC CACT CGT AT GAT GACT GGT GCAG GCAAT AT C CT GAAGAA 


120 


Qy 


1113 


ACATGCAGCAGAACAAGCCAAGAAGGCCTCCAGCATGAGCGAGGTGCACACCGATGAGCC 


1172 




I || | I I I I I II I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 




Db 


121 


ACAT GCAGCAGAACAAGC CAAGAAGGC CTC C AGCAT GAGC GAGGT GCACAC C GAT GAGC C 


180 


Qy 


1173 


TGAGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTACCAGTGCCTGGAGAACTG 


1232 




iia.iailllllil 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 




Db 


181 


TGAGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTACCAGTGCCTGGAGAACTG 


240 


Qy 


1233 


T GGGGCT GTACT C CT GACAGT GGT GAGGAAAGGGG GAGACAT GT CAAAGAC CAT GT AT GT 


1292 




1 1 1 1 1 1 1 1 1 1 1 1 Ml 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


241 


T GGGGCT GT ACT C CT GACAGT GGT GAGGAAAGGGGGAGAC AT GT CAAAGAC CAT GT AT GT 


300 


Qy 


1293 


G GACT ACAAAACAGAG GAT GGTT CT GC CAAT GCAGGGGCT GACT AT GAGT T CAC AGAGGG 


1352 




1 1 1 1 1 1 1 1 | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 




Db 


301 


GGACT ACAAAACAGAGGATG GTT CT GC CAAT GCAGGG GCT GACT AT GAGT T CACAGAGGG 


360 


Qy 


1353 


CAC GGTGGTTCT G AAG C CAG GAG AG AC C CAG AAG GAG TTCTCCGTGGG CAT AAT T GAT G A 


1412 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 




Db 


361 


CAC GGT GGT T CT GAAGC CAGGAGAGAC CCAGAAGGAGT T CT C C GT GGGC AT AAT T GAT GA 


420 


Qy 


1413 


C G AC AT T T T T GAG GAG GAT G AAC AC T T CT T T GT AAG GT T GAG CAAT GT C C G CAT AG AG G A 


1472 




I I I M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


421 


C GAC AT T T T T GAG GAG GAT GAAC ACT T CT T T GT AAGGT T GAG CAAT GT C C G C AT AGAG GA 


480 


Qy 


1473 


GGAGCAGCCAGAGGAGGGGATGCCTCCAGCAATATTCAACAGTCTTCCCTTGCCTCGGGC 


1532 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 




Db 


481 


GGAGC AG CCAGAGGAGG GGAT GC CT C CAG CAAT ATT CAAC AGT CTT C CCT T GC CT C GGGC 


540 


Qy 


1533 


TGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGATGACCATGCAGGCAT 


1592 




| | | | I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


541 


TGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGATGACCATGCAGGCAT 


600 



Qy 1593 CT T C ACT T T T GAATGT GAT ACT AT T CAT GT C AGT GAGAGT ATT GGT GTT AT GGAGGT CAA 1652 

1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 601 CTTCACTTTT GAATGT GATACTATTCATGT CAGT GAGAGTATT GGT GTTATGGAGGT CAA 660 

Qy 1653 GGTTCTGCGGACATCAGGTGCCCGGGG-TACAGTCATCGTCCCCTTTAGGACAGTAGAAG 1711 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 GGTTCTGCGGACATCAGGTGCACGGGGCTACAGTCATCGTCCCCTTTAGGACAGTAGAAG 720 

Qy 1712 GGACAGCCAAGGGTGGCGGT— GAGGACTTTGAAGACACATATGGGGAGTTGGAATT 1766 

I I I I I I I I I I I I I I II I I I I Mill I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 GGACAG C CAAGGGTG GC G GT C GAC GGACT CT GAAGACAC AT AT GGGGAGT TT GGAAT 777 



RESULT 13 

BX368185 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



BX368185 920 bp mRNA linear EST 08-MAY-2003 

BX368185 Homo sapiens NEUROBLASTOMA COT 50-NORMALIZED Homo sapiens 
cDNA clone CS0DD006YJ07 5-PRIME, mRNA sequence. 
BX368185 

BX368185.1 GI:30445119 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 920) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref @genoscope . ens . f r , Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies, a division of 
Invitrogen. This sequence belongs to sequence cluster 7256. r For 
more information about this cluster, see 
http : //www. genoscope . ens . f r/ 

cgi-bin/cluster.cgi?seq=CS0BAA006ZD07__CS00533_2&cluster=7256. r. 
Contact : Feng Liang Email : fliang@lifetech.com URL : 
http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CSOBAA006ZD07_CS00533_2 . 
Location/Qualifiers 
1. .920 

/organism- "Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="CS0DD006YJ07" 

/ tissue_type="NEUROBLASTOMA COT 50-NORMALIZED" 
/clone_lib="Homo sapiens NEUROBLASTOMA COT 50-NORMALIZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



ORIGIN 



Query Match 

Best Local Similarity 



39.6%; 
95.1%; 



Score 737.8; DB 13; Length 920; 
Pred. No. 1.3e-205; 



Matches 827; Conservative 0; Mismatches 33; Indels 10; Gaps 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 50 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 109 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 12 0 

I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 110 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 169 

Qy 121 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 17 0 AC AGG G C AGAACAAT GAGT CCT GTT C AG GGT CAT C G GACT GCAAGGAGG GT GT CAT CCT G 22 9 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I 
Db 230 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 2 89 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 290 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 349 

Qy 301 T CT ATT GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAATT AAGAAACCCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 350 T CT ATT GAAGT CAT CACCT CT CAAGAGAGGGAG GT GACAAT TAAGAAAC CCAAT GGAGAA 4 09 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 42 0 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 410 AC CAGCAC AAC C ACT ATT C GGGT CT GGAAT GAAACT GT CT CCAAC CTGACC CT T AT GGC C 4 69 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 470 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 529 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I 
Db 530 AT T GCT GGT GAT CT GGGAC CT T CT AC CAT TGT AGG GAGT GCAGC CT TCAAC AT GT T CAT C 589 

Qy 541 AT CAT T GGCAT C T GT GT CT AC GT GAT CCCAGACGGAGAGACT CGCAAGAT CAAGCAT CTA 600 

I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 590 AT CATT GGCAT CT GT GT CT AC GT GAT C C CAGAC GGAGAGACT CGCAAGAT CAAGC ATCT A 649 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 650 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 7 09 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 710 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCT-CTCACTCTCTTTTTC 7 68 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 7 69 -TTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGAT-AACGACTGGTTTTTACCAA — TC 824 

Qy 781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 84 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 825 ATGCCCAAAAAGTCCCG-ACAGACCAACCCGNGGGATTT TCTAGAGACCGAGGTGC 879 



Qy 



Db 



841 CAC C CTAAGGGCATT GAGAT GGAT GGGAAA 870 

I II I I I I I I I I I I I I I I I I I I 
880 CCACCCTAGGGCCTTGGGATGGTGGGAAAA 909 



RESULT 14 
AK035163 

LOCUS AK035163 4374 bp mRNA linear HTC 18-SEP-2003 

DEFINITION Mus musculus 12 days embryo embryonic body between diaphragm region 
and neck cDNA, RIKEN full-length enriched library, clone : 9430095C22 
product: SODIUM/ CALCIUM EXCHANGER 2 PRECURSOR (NA (+) /CA ( 2+ ) -EXCHANGE 
PROTEIN 2) homolog [Rattus norvegicus] , full insert sequence. 
ACCESSION AK035163 

VERSION AK035163.1 GI:26084435 

KEYWORDS HTC; CAP trapper. 
SOURCE Mus musculus (house mouse) 

ORGANISM Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 
REFERENCE 1 

AUTHORS Carninci,P. and Hayashizaki, Y. 
TITLE High-efficiency full-length cDNA cloning 

JOURNAL Meth. Enzymol . 303, 19-44 (1999) 
MEDLINE 99279253 
PUBMED 10349636 
REFERENCE 2 

AUTHORS Carninci,P., Shibata,Y., Hayatsu,N., Sugahara,Y., Shibata,K., 

Itoh,M., Konno,H., Okazaki,Y., Muramatsu,M. and Hayashizaki, Y . 
TITLE Normalization and subtraction of cap-trapper-selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new genes 
JOURNAL Genome Res. 10 (10) , 1617-1630 (2000) 
MEDLINE 20499374 
PUBMED 11042159 
REFERENCE 3 

AUTHORS Shibata,K., Itoh,M., Aizawa,K., Nagaoka,S., Sasaki, N. 

Konno,H., Akiyama,J., Nishi,K., Kitsunai,T., Tashiro,H. 
Sumi,N., Ishii,Y., Nakamura,S., Hazama,M., Nishine,T. 
Yamamoto,R., Matsumoto, H . , Sakaguchi , S . , Ikegami,T., Kashiwagi, K. , 
Fujiwake,S., Inoue,K., Togawa,Y., Izawa,M., Ohara,E., Watahiki,M., 
Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S., Kawai,J., 
Okazaki,Y., Muramatsu, M. , Inoue,Y., Kira,A. and Hayashizaki, Y. 

TITLE RIKEN integrated sequence analysis (RISA) system — 384-format 

sequencing pipeline with 384 multicapillary sequencer 

JOURNAL Genome Res. 10 (11), 1757-1771 (2000) 

MEDLINE 20530913 
PUBMED 11076861 
REFERENCE 4 

AUTHORS The RIKEN Genome Exploration Research Group Phase II Team and the 

FANTOM Consortium. 
TITLE Functional annotation of a full-length mouse cDNA collection 

JOURNAL Nature 409, 685-690 (2001) 
REFERENCE 5 

AUTHORS The FANTOM Consortium and the RIKEN Genome Exploration Research 

Group Phase I & II Team. 
TITLE Analysis of the mouse transcriptome based on functional annotation 

of 60,770 full-length cDNAs 



Carninci, P . , 

Itoh,M. , 
Harada, A. , 



JOURNAL 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 



COMMENT 



FEATURES 

source 



rnisc feature 



Nature 420, 563-573 (2002) 
6 (bases 1 to 4374) 

Adachi,J., Aizawa,K., Akimura, T. , Arakawa,T., Bono,H., Carninci,P., 
Fukuda,S., Furuno,M. , Hanagaki,T., Hara,A., Hashizume, W. , 
Hayashida, K. , Hayatsu,N., Hiramoto, K. , Hiraoka,T., Hirozane,T., 
Hori,F., Imotani, K. , Ishii,Y., Itoh,M., Kagawa,I., Kasukawa,T., 
Katoh,H., Kawai,J., Kojima,Y., Kondo,S., Konno,H., Kouda,M., 
Koya,S., Kurihara, C . , Matsuyama, T . , Miyazaki,A., Murata,M., 
Nakamura, M. , Nishi,K., Nomura, K. , Numazaki,R., Ohno,M., Ohsato,N., 
Okazaki,Y., Saito,R., Saitoh, H . , Sakai,C, Sakai,K., Sakazume, N . , 
Sano,H., Sasaki, D., Shibata,K., Shinagawa, A. , Shiraki,T., 
Sogabe,Y., Tagami,M., Tagawa,A., Takahashi, F. , Takaku-Akahira, S . , 
Takeda,Y., Tanaka,T., Tomaru,A., Toya,T., Yasunishi, A. , 
Muramatsu,M. and Hayashizaki, Y. 
Direct Submission 

Submitted (16- JUL-2001) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN) , Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama, 
Kanagawa 230-0045, Japan (E-mail : genome-res @gsc. riken. go. jp, 
URL:http: //genome. gsc. riken. go. jp/, Tel : 81-45-503-9222, 
Fax:81-45-503-9216) 

cDNA library was prepared and sequenced in Mouse Genome 
Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. 

Please visit our web site for further details. 
URL:http: //genome. gsc. riken. go. jp/ 
URL: http : / / f antom. gsc. riken . go. jp/ . 

Location/Qualifiers 

1. .4374 

/organism="Mus mus cuius" 

/mol__type= ,, mRNA M 

/strain="C57BL/6J" 

/ db_xr e f = " FANTOM_DB : 9430095C22" 

/db_xref="MGI : 2399390" 

/db_xref="taxon: 10090" 

/clone="9430095C22" 

/tissue_type="embryonic body between diaphragm region and 
neck" 

/clone_lib="RIKEN full-length enriched mouse cDNA library" 
/dev_stage="12 days embryo" 
281. .3046 

/note-"SODIUM/CALCIUM EXCHANGER 2 PRECURSOR 
(NA(+) /CA(2+) -EXCHANGE PROTEIN 2) homolog [Rattus 
norvegicus] ( SWISSPROT | P48768 , evidence: FASTY, 97%ID, 
100%length, match=27 63) 
putative" 



ORIGIN 



Query Match 38.1%; Score 710.4; DB 11; Length 4374; 

Best Local Similarity 65.9%; Pred. No. 4.5e-197; 

Matches 1092; Conservative 0; Mismatches 536; Indels 30; Gaps 3; 



QY 



136 GAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTGCCAATCTGGTACCCG 195 
II III MINI I I I I I II I II I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



4 01 GAAGGCTGCCAAGGTTCCTACCGCTGCCAACCAGGTGTGCTGCTGCCTGTGTGGGAACCC 4 60 



196 GAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTATTTTGTGGCCCTGATA 

Ml I I I I II II II I I I I I I I I I I III I I II II I I I II II II II I 

4 61 GAGGACCCATCGCTGGGCGACAAGGTTGCACGGGCCGTGGTGTACTTTGTGGCCATGGTC 

256 TACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCATCTATTGAAGTCATC 

I I I I I I I I I I I II I I I I I I I I I I I I I II II II II I I I I I I I I I I I I I I I I I 

521 TACAT GTT CCT GGGT GT GTCT ATCATT GCCGATCGATTTAT GGCAT CCATT GAGGTCAT C 



316 



581 



376 



641 



436 



701 



496 



761 



556 



821 



616 



881 



676 



941 



ACCT CTCAAGAGAGGGAGGT GACAATT AAGAAACC CAAT GGAGAAACCAGCACAACCACT 
I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I III 
ACAT C CAAGGAGAAAGAGAT C AC CAT C AC CAAGG CAAAT GGGGAGACC AGC GT GGGC AC G 

ATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCT 

I II I I I I I I I II II II I I I I II I I II II II I I I I I I I I I I I I I I II 

GTGCGCATCTGGAACGAGACGGTGTCCAACCTTACACTCATGGCCCTGGGCTCCTCAGCG 

CCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I 

CCTGAGATTCTGTTGACTGTCATCGAGGTCTGTGGCCACAACTTCCAGGCCGGTGAGCTA 

GGACCTT CTACCATT GTAGGGAGT GCAGCCTT CAACAT GTT CAT CAT C ATT GGCAT CT GT 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I MINI I I I I 

GGCCCAGGCACCATCGTGGGCAGTGCCGCCTTCAACATGTTTGTGGTCATTGCTGTTTGT 

GT CTACGT GAT CCCAGAC GGAGAGACT CGCAAGAT CAAGCAT CT ACGAGT CTT CTTCAT C 

I I I I I I I I I I I I I I I II I I I I II I I I I I I II I I I I I I I I I I I II 
GTGTATGTCATCCCGGCTGGCGAGAGCCGTAAGATCAAGCACCTGAGGGTCTTCTTTGTC 

ACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCC 

II II I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I II I I I I I I 

ACAGCCTCCTGGAGCATCTTTGCCTATGTCTGGCTTTATCTCATTCTAGCAGTTTTCTCC 



255 



520 



315 



580 



375 



640 



435 



700 



495 



760 



555 



820 



615 



880 



675 



940 



735 



CCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTC 

II I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I II I I I I I II I 

CCAGGTGTAGTCCAGGTGTGGGAGGCACTGCTCACACTGATCTTCTTCCCGGTGTGTGTG 1000 



736 



795 



CTTCTGGCCTGGGTGGCAGATA/yVCGACTGCTCTTCTACAAATACATGCACAT^^AAGTAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
1001 GTGTTTGCCTGGATGGCGGACAAGCGACTGCTCTTCTACAAGTACGTGTACAAGCGCTAC 1060 



796 



855 



CG C ACAGACAAAC AC C GAGGAAT TAT C AT AGAGACAGAGGGT GACC AC C CTAAGGGC ATT 

MINIM I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

1061 CGCACCGAC C CT C GCAGT GGAAT CAT CAT C GGGGCAGAGGGAGACC C ACC CAAGAGCAT C 1120 

856 GAGAT GGAT GGGAAAAT GAT GAATTC C CATTTT CT AGAT G GGAACCTG 903 

I I I I I II I I I I I I I I I I I I I II 

1121 GAGCTGGACGGCACATTCGTGGGCACTGAGGTCCCTGGCGAGCTGGGCGCATTGGGCACA 1180 



904 



GT G C C C CT GGAAGGGAAGGAAGT G GAT GAGT C C CGC AGAGAGAT GAT C C G GATT CT CAAG 963 

I II I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I 
1181 GGT CCT GCT GAGGC G C GT GAACT AGAT GC CAGC C GGC GT GAG GT CAT CC AGAT C CT T AAG 1240 

964 GAT CT GAAGC AAAAAC AC C C AG AGAAG GACTT AGAT CAGCT GGT GGAGAT GGCCAAT TAC 1023 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1241 GACTT GAAGCAGAAGCACC CGGATAAGGACCTGGAGCAGCTGAT GGGCAT CGCCAAGTAC 1300 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 



1024 TAT GCT CTT T CC CAC CAAC AGAAGAG C CG C GC CT T CTAC C GT AT CCAAG C CACT C GT AT G 1083 

I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 

1301 TATGCACTGCTGCACCAGCAGAAGAGCCGCGCCTTCTACCGCATCCAGGCCACGCGGCTG 1360 

1084 AT GACT GGT GCAGGCAATATCCT GAAGAAACATGCAGCAGAACAAGCCAAGAAGGCCTC C 1143 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III II I 

1361 ATGACAGGTGCGGGCAATGTGCTGCGCAGACATGCTGCGGATGCTGCCCGCAGG CCG 1417 

1144 AG CAT GAG C GAG G T G CAC AC C GAT GAG C C T GAG GAC T T TAT T T C C AAG GTCTTCTTT G AC 1203 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1418 GGAGCCACCGATGGTGCCCCCGATGATGAGGACGATGGTGCCAGTCGCATCTTCTTTGAG 14 77 

1204 CCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGGAAA 12 63 

II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1478 CCCAGCCTCTATCACTGCCTGGAAAACTGCGGGTCAGTGCTGCTGTCCGTGGCTTGCCAG 1537 

1264 G G GGGAGACAT GT CAAAGAC CAT GTAT GT GGACTACAAAACAGAGGAT GGTT CT GC CAAT 1323 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

1538 GGCGGTGAGGGCAACAGCACCTTCTACGTGGACTACCGTACCGAGGACGGTTCTGCAAAG 1597 

1324 GCAGGGGCT GACT AT GAGTTCACAGAGGGCAC GGTGGTT CTGAAGCCAGGAGAGACCCAG 1383 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

1598 GCAGGCTCCGATTATGAGTACAGCGAGGGCACGCTGGTGTTCAAGCCCGGGGAGACGCAG 1657 

1384 AAGGAGTTCTCCGTGGGCATAATTGATGACGACATTTTTGAGGAGGATGAACACTTCTTT 1443 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1658 AAGGACCTGCGCATCGGGATCATCGACGACGACATCTTCGAGGAGGATGAGCACTTCTTC 1717 

1444 GTAAGGTT GAGCAAT GT CC GCAT AGAGGAGGAGCAGCCAGAGGAGGGGAT GCCT CCAGCA 1503 

II I I I I I II III II III III I M 

1718 GTGAGGCTGCTGAACCTGCGTGTGGGCGATGCTCAGGGCATGTTCGAG 1765 



1504 ATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTT 

I I I I I III II Ml I I I I I I I 

1766 CCCGACGGCGGTGGGCGGCCCAAGGGGCGGCTGGTGGCGCCGCTGCTGGCCACTGTC 



1563 



1822 



1623 



1564 ACCATCTT GGAT GAT GAC CAT GCAGGCATCTT CACTTTTGAATGT GATACT ATTCAT GTC 

I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

1823 ACCATCCTGGACGACGACCACGCGGGCATCTTCTCCTTCCAGGACCGCCTGCTGCATGTG 18 82 

1624 AGT G AGAGT AT T GGT GT TAT G GAG GT C AAG GTTCTGCG GAC AT C AG GT G C C C G GG GT AC A 1683 

I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

1883 AGCGAGTGCATGGGCACTGTGGATGTGCGCGTGGTTCGCAGCTCGGGCGCCCGTGGCACT 1942 

1684 GTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTTGAA 1743 

II I I I I I I I I I I I II I I I I I I I I I I I II I I I I II II 

194 3 GTACGCCTCCCCTACCGCACAGTGGACGGCACGGCCCGTGGCGGTGGTGTACATTACGAG 2002 

1744 GACACAT AT GG G GAGT T G GAAT T CAAGAAT GAT GAAAC 17 81 

II I I I I I I I I I I I I I I I I I II I I I I I 

2003 GAT GCTT GT GGAGAGCT GGAGT T C G GCGAT GAT GAGAC 2040 



RESULT 15 
BX390204 

LOCUS BX390204 



922 bp mRNA linear EST 08-MAY-2003 



DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



BX390204 Homo sapiens NEUROBLASTOMA COT 50-NORMALIZED Homo sapiens 

cDNA clone CS0DD006YJ07 5-PRIME, mRNA sequence. 

BX390204 

BX390204.1 GI:30461412 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 922) 

Li,W.B., Gruber,C, Jessee, J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref @genoscope . ens . f r , Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies, a division of 
Invitrogen. This sequence belongs to sequence cluster 7256. r For 
more information about this cluster, see 
http: //www. genoscope . ens . f r/ 

cgi-bin/cluster . cgi?seq=CS0BAG010ZAl l__CS00945_l&cluster=7256 . r . 
Contact : Feng Liang Email : fliang@lifetech.com URL : 
http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CS0BAG010ZA11_CS00945_1 . 

Location/Qualifiers 

1. .922 

/organism="Homo sapiens" 
/mol_type= ,, mRNA" 
/db_xref="taxon: 9606" 
/clone="CS0DD006YJ07" 

/tissue_type= "NEUROBLASTOMA COT 50 -NORMALIZED" 
/clone_lib="Homo sapiens NEUROBLASTOMA COT 50 -NORMALIZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



ORIGIN 



Query Match 38.0%; Score 708.4; DB 13; Length 922; 

Best Local Similarity 91.9%; Pred. No. 6e-197; 

Matches 847; Conservative 0; Mismatches 66; Indels 9; 



Gaps 



9; 



Qy 

Db 



30 CTCTGCCTTCCTCCATTTTGGGCTGGTTACCTTTGTGCTCTTCCTGAATGGTCTTCGAGC 89 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I 

3 CTCTGCCTTCCTCC-TTTTGGGCTGGTTACCTTTGTGCTCTTCCTG-ATGGTCTTCGAGC 60 



Qy 

Db 

Qy 

Db 



90 AGAGGCTGGTGGCTCAGGGGACGTGCCAAGCACAGGGCAGAACAATGAGTCCTGTTCAGG 149 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

61 AGAGGCT GGT GGCT CAGGGGACGT GCCAAGCACAGGGCAGAACAATGAGT CCT GTTCAGG 120 

150 GTCATCGGACTGCAAGGAGGGTGTCATCCTGCCAATCTGGTACCCGGAGAACCCTTCCCT 209 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

121 GTCATCGGACTGCAAGGAGGGTGTCATCCTGCCAATCTGGTACCCGGAGAACCCTTCCCT 180 



Qy 210 TGGGGACAAGATTGCCAGGGTCATTGTCTATTTTGTGGCCCTGATATACATGTTCCTTGG 269 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 


181 


Qy 


Z 1 U 


Db 


241 


Qy 


330 


Db 


301 


Qy 


390 


Db 


361 


Qy 


450 


Db 


421 


Qy 


510 


Db 


481 


Qy 


570 


Db 


541 


Qy 


630 


Db 


601 


Qy 


690 


Db 


661 


Qy 


748 


Db 


721 


Qy 


8 06 


Db 


781 


Qy 


866 


Db 


838 


Qy 


926 


Db 


898 



181 TGGGGACAAGATTGCCAGGGTCATTGTCTATTTTGTGGCCCTGATATACATGTTCCTTGG 240 

G GT GT CC AT CAT T GCT GACC GC TT C AT GGCAT CT ATT GAAGT CAT CAC CT CT CAAGAGAG 329 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M i I I I I I II 
GGT GT CC AT CAT T GCT GAC C G CTT C AT GGCAT CT AT T GAAGT CAT CAC CT CT CAAGAGAG 300 

G GAG GT GACAAT T AAGAAAC C CAAT GGAGAAACC AGCACAAC CAC TAT T CGG GT CT GGAA 389 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGAG GT GACAAT T AAGAAAC C CAAT GGAGAAAC C AGCACAAC CAC TAT T C G GGT CT GGAA 360 

TGAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCT 449 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCT 420 

CTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTACCAT 509 

I | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTACCAT 480 

T GT AGGGAGT GCAGCCT T CAACAT GTT CAT CAT C ATT GGCAT CT GT GT CT AC GT GAT C C C 569 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
T GT AGGGAGT GCAGC CTT CAACAT GTT CAT CAT CATT GGCAT CT GT GT CTACGT GAT CCC 540 

AGACGGAGAGACTCGCAAGATCAAGCATCTACGAGTCTTCTTCATCACCGCTGCTTGGAG 62 9 

I I I I I I M II I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGAC GGAGAGACT C GCAAGAT CAAGCAT TT AC GAGT CT T CTT CAT CAC CGCT GCT T GGAG 600 

TATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCA 689 

I I I I I I I I I I I I I I II II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TATCTTTGCCTACATCTGGCTCTATATGATTCTGCCAGTCTTCTCCCCTGGTGTGGTCCA 660 

GGTTT-GGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTG-TCCTTCTGGCCTGG 747 

I I I I I I I I I I II I I I I I I I I I I I I I I I II III I I I I I I I I I II II III I I I I 

GGTTTGGGGAAGGCCTCCTCACTCTCTTTTTTTTTTCAGTGTGTGTTCTTTTTGGTCTGG 72 0 



I I I I I I I I I II I I I I I I I I III I I I I I I I I I M I I I I I II I I I I I I I I I I I 



I I I I I I M I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I II II 



I I I I I I I I I I I I I I I II II M I I I I I I I M INI 





CGTACCATCTCTCCCGTCAGTT 919 



Search completed: June 25, 2004, 15:31:20 
Job time : 4276.53 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 
Run on: 



June 25, 2004, 04:06:20 ; Search time 7009.69 Seconds 

(without alignments) 
11519.487 Million cell updates/sec 



Title: US-10-054-680-3 
Perfect score: 1863 

Sequence: 1 atggcgtggttaaggttgca ggaaagccagtattgggtga 1863 



Scoring table: IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 



3470272 seqs, 21671516995 residues 



Total number of hits satisfying chosen parameters: 



6940544 



Minimum DB seq length: 
Maximum DB seq length: 



0 

2000000000 



Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



Database 



GenEmbl : * 
1 : gb_ba : * 
gb_htg : * 
gb_in : * 
gb_om : * 
gb_o v : * 
gb_pat : * 
gb_ph : * 
gb_pl : * 
gb__pr : * 
gb_ro: * 
gb_sts : * 
gb_s y : * 
gb_un : * 
gb_vi : * 
em_ba:* 
em_f un : * 
em hum: * 



2: 
3: 
4: 
5: 
6: 
7: 
8: 
9: 
10: 
11: 
12: 
13: 
14: 
15: 
16: 
17: 
18: 
19: 
20: 
21: 
22: 
23: 
24: 
25: 
26: 
27: 



em_in: * 
ernjmi : * 
em_om: * 
em_or : * 
em_ov: * 
em_pat : * 
em_ph : * 
em p 1 : * 
em_ro : * 
em sts:* 



28: 


em 


un : * 


29: 


em 


vi : * 


30 


em 


htg hum:* 


31 


em 


htg inv:* 


32 


em 


htg other:* 


33 


em 


htg mus : * 


34 


em 


htg pin:* 


35 


em_ 


htg rod:* 


36 


em_ 


htg mam:* 


37 


em 


htg vrt:* 


38 


: em 


sy : * 


39 


: em 


htgo hum:* 


40 


j em 


htgo mus : * 


41 


: em 


htgo other: 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 

SUMMARIES 

% 

Result Query 

No. Score Match Length DB ID Description 



1 


1863 


100. 


0 


1863 


6 


AX496813 


AX496813 Sequence 


2 


1861 .4 


99. 


9 


5146 


9 


AF510503 


AF510503 Homo sapi 


3 


1784.6 


95. 


8 


2766 


6 


AX496811 


AX496811 Sequence 


4 


1784.6 


95. 


8 


3812 


6 


AX496815 


AX496815 Sequence 


5 


1784.4 


95. 


8 


2534 


9 


HSNCX22 


X93017 Homo sapien 


6 


1783 


95. 


7 


2781 


6 


AX299471 


AX299471 Sequence 


7 


1783 


95. 


7 


2782 


6 


AX476818 


AX476818 Sequence 


8 


1783 


95. 


7 


2837 


9 


HSA304853 


AJ304853 Homo sapi 


9 


1783 


95. 


7 


2966 


6 


AX480881 


AX480881 Sequence 


10 


1783 


95. 


7 


5250 


9 


AF510501 


AF510501 Homo sapi 


11 


1783 


95. 


7 


5268 


9 


AF510502 


AF510502 Homo sapi 


12 


1782.8 


95. 


7 


126512 


6 


AX476820 


AX476820 Sequence 


13 


1782.8 


95. 


7 


145118 


9 


AF508982 


AF508982 Homo sapi 


14 


1782.8 


95. 


7 


146055 


2 


AC009607 


AC009607 Homo sapi 


15 


1782.8 


95. 


7 


206256 


9 


CNS01RGT 


AL160191 Human chr 


16 


1782.4 


95. 


7 


2840 


9 


HSA304852 


AJ304852 Homo sapi 


17 


1546.2 


83. 


0 


4640 


10 


BC052435 


BC052435 Mus muscu 


18 


1544.4 


82. 


9 


183707 


10 


AC124384 


AC124384 Mus muscu 


19 


1544 


82. 


9 


1784 


10 


AF321404 


AF321404 Mus muscu 


20 


1544 


82. 


9 


3435 


10 


AF453257 


AF453257 Mus muscu 


21 


1527 


82. 


0 


4854 


10 


RNU53420 


U53420 Rattus norv 


22 


1526.8 


82. 


0 


247722 


2 


AC099080 


AC099080 Rattus no 


23 


1331.4 


71. 


5 


3838 


9 


HSA508602 


AJ508602 Homo sapi 


24 


938.6 


50. 


4 


77568 


2 


AC139418 


AC139418 Homo sapi 


25 


913.2 


49. 


0 


77568 


2 


AC139418 


AC139418 Homo sapi 


26 


810.6 


43. 


5 


4087 


4 


BOVEXCHANG 


L06438 Bos taurus 


27 


810.6 


43. 


5 


4087 


6 


AX360315 


AX360315 Sequence 


28 


805.2 


43. 


2 


3199 


4 


DOGSNCE 


M57523 Dog cardiac 


29 


799.4 


42. 


9 


3150 


4 


CATSCE 


L35846 Felis catus 


30 


796.2 


42. 


7 


3292 


4 


OCU52665 


U52665 Oryctolagus 


31 


795 


42, 


7 


1920 


4 


FCNCX1S4 


U67075 Felis catus 


32 


792.8 


42. 


6 


1832 


9 


AF109888 


AF109888 Macaca mu 


33 


792.8 


42. 


6 


2965 


9 


AF107593 


AF107593 Macaca mu 



34 


786 


.4 


42. 


2 


3184 


9 


HUMNACAA 


M96368 Homo sapien 


35 


785 


.2 


42. 


1 


2129 


9 


HSNCX12 


X91213 H. sapiens n 


36 


785 


.2 


42. 


1 


179343 


9 


AC007281 


AC007281 Homo sapi 


37 


784 


.8 


42. 


1 


2814 


9 


AF108389 


AF108389 Homo sapi 


38 


784 


. 8 


42. 


1 


2883 


9 


AF108388 


AF108388 Homo sapi 


39 


784 


.8 


42. 


1 


3002 


9 


AF128524 


AF128524 Homo sapi 


40 


784 


.8 


42. 


1 


3250 


9 


HUMCNC 


M91368 Human Na+/C 


41 


784 


.4 


42. 


1 


6023 


9 


HSM808447 


BX648299 Homo sapi 


42 


783 


.4 


42. 


1 


3168 


10 


CPU04955 


U04955 Cavia porce 


43 


765 


.8 


41. 


1 


2805 


10 


AF109163 


AF109163 Rattus no 


44 


765 


.8 


41. 


1 


3037 


10 


RNSCEA1 


X68812 R.norvegicu 


45 


765 


.8 


41. 


1 


3126 


10 


RNSCEA2 


X68813 R.norvegicu 



ALIGNMENTS 



RESULT 1 
AX496813 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

FEATURES 

source 



linear PAT 26-SEP-2002 



AX496813 1863 bp DNA 

Sequence 3 from Patent WO02059316. 
AX496813 

AX496813.1 GI:23342336 



Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Hilbun,E. and Friddle,C.J. 

Human ion exchanger proteins and polynucleotides encoding the same 
Patent: WO 02059316-A 3 01-AUG-2002; 
LEXICON GENETICS INC (US) 

Location/Qualifiers 

1. .1863 

/organism="Homo sapiens" 
/mol_type="unas signed DNA" 
/db xref="taxon: 9606" 



ORIGIN 



Query Match 100.0%; Score 1863; 

Best Local Similarity 100.0%; Pred. No. 0; 
Matches 1863; Conservative 0; Mismatches 



DB 6; Length 18 63; 
0; Indels 0; 



Gaps 



0; 



Qy 


1 


Db 


1 


Qy 


61 


Db 


61 


Qy 


121 


Db 


121 



ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

ACAGG GC AGAACAAT GAGT CCT GTT CAGGGT CAT CGGACT GCAAGGAGGGT GT CAT CCT G 180 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ACAGGGC AGAACAAT GAGT C CT GT T CAG GGT CAT CGGACT GCAAGGAGGGT GT CAT C CT G 180 



Qy 



181 CCAAT CT GGT AC C C GGAGAAC CCT T CC CTT GGGGACAAGAT T GC CAGG GT CAT T GT CT AT 240 



Db 


181 


CCAAT CT GGT AC C C GGAGAAC CCT T C C CTT GG GGACAAGAT T GC CAGGGT CAT T GT CT AT 


240 


Qy 


241 


TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 


300 




i i i i i i i i i t j i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i I I I I I I I I 
1 1 1 1 1 M 1 1 1 1 1 II 1 1 11 1 1 1 II 1 II 1 1 1 1 M II 1 II 1 1 II 1 1 II i 1 1 1 1 1 M 11 1 II 1 1 




Db 


241 


TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 


300 


Qy 


301 


T CT ATT GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAAT TAAGAAAC C CAAT GGAGAA 


360 




i i i i i i i i i i i i i i i i i i i > i i i i i i i i i i i i i i i i i i i i i f i i i i i i i i i i i i I l l l l l 
1 I I 1 1 1 1 1 1 1 1 1 II 1 II 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II M 




Db 


301 


TCT AT T GAAGT CAT CAC CT CTCAAGAGAG GGAGGT GACAAT TAAGAAAC C CAAT GGAGAA 


360 


Qy 


361 


ACCAGCACAACCACTATTCGGGT CTGGAATGAAACT GTCT CCAACCT GACCCTTAT GGC C 


420 




i i i i i i t i i i i i i i i I I i I I I I I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 I 1 1 1 ! 1 1 1 1 1 1 




Db 


361 


AC C AG CACAAC CAC TAT T C G GGT CT GGAAT GAAACT GT CT CCAAC CT GAC C CT T AT GGC C 


420 


Qy 


421 


CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 


480 




i i i i i i i i i i i i i i I I I I I I 1 I I 1 1 1 i 1 1 1 1 I 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 \ 1 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


421 


CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 


480 


Qy 


481 


AT T GCT GGT GAT CT GGGAC CTT CT AC CAT T GT AGGGAGT GC AGCCT T CAACAT GTT CAT C 


540 




i i i i i ■ i i i i i i i i i i i i i i i ■ i i i i t i i i i i i i i i i i ] i i i i i i i i i i i i 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 




Db 


481 


AT T GCT GGT GAT CT GGGAC CTT CT AC CAT T GT AGGGAGT G CAG CCTT CAACAT GTT CAT C 


540 


Qy 


541 


AT CAT T GGC AT CT GT GT CT AC GT GAT CC CAGACGGAGAGACT C GCAAGAT CAAGC AT CT A 


600 




i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 

1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 




Db 


541 


AT CAT T GGCATCT GT GT CTACGT GAT CCCAGACGGAGAGACT C GCAAGAT CAAGC AT CT A 


600 


Qy 


601 


CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 


660 




i . i i i i i i i i i i i i i t i i i t i i i i i i i i i i i i i i i i \ i i i i i i i i i i i i i 

I 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 II 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


601 


CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 


660 


Qy 


661 


CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 


720 




1 1 1 1 1 1 1 1 1 1 1 M 1 1 M M I M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


661 


CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 


720 


Qy 


721 


TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 


780 




■ i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i t i i i i i i i i i i t i i i i i i i i i i i i 

1 1 II 1 1 II 1 II 1 1 1 1 M 1 1 1 II 1 II 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 




Db 


721 


TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 


780 


Qy 


781 


ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 


840 




i i i i i i ■ i i i i i i i i ■ i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 

I | | I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II II 1 1 II II 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


781 


ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 


840 


Qy 


841 


CAC C CTAAGGGC AT T GAGAT GGAT GGGAAAAT GAT GAATT C C CAT T TT CT AGAT GG GAAC 


900 




■ i i i i i i i i i i i i i i i i i i i i i i i i i t i i i i i t i i i i i i i i i i i i i i i i t i i i i i i i i i i 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M II 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


841 


CAC C CT AAGGGCATT GAGATG GAT GGGAAAAT GAT GAAT T C C CAT T TT CT AGAT GGGAAC 


900 


Qy 


901 


CTGGT GCCC CT GGAAGGGAAGGAAGT GGAT GAGTC CCGCAGAGAGAT GAT CCGGATT CT C 


960 




I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


901 


CTGGTGCCCCT GGAAGG GAAGGAAGT G GAT GAGT C CC GCAGAGAGAT GAT C C GGAT T CT C 


960 


Qy 


961 


AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGATGGCCAAT 


1020 


Db 


961 


I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 

AAGGAT CT GAAGCAAAAACAC C CAGAGAAG GACT TAGATCAGCT G GTG GAGAT GGCCAAT 


1020 



Qy 1021 



TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 108 0 
I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 



Db 


1021 


Qy 


1081 


Db 


1081 


Qy 


1141 


Db 


1141 


Qy 


1201 


Db 


1201 


Qy 


1261 


Db 


1261 


Qy 


1321 


Db 


1321 


Qy 


1381 


Db 


1381 


Qy 


1441 


Db 


1441 


Qy 


1501 


Db 


1501 


Qy 


1561 


Db 


1561 


Qy 


1621 


Db 


1621 


Qy 


1681 


Db 


1681 


Qy 


1741 


Db 


1741 


Qy 


1801 


Db 


1801 


Qy 


1861 


Db 


1861 



1021 TACT AT GCTCTTTCC CAC CAACAGAAGAGC C GC GC CT T CT AC CGT AT C CAAG CCACT C GT 1080 

AT GAT GACT GGT GCAGGCAATAT C CT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 114 0 

I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I M 

AT GAT GACT GGT G CAGG CAAT AT C CT GAAGAAACAT GCAGCAGAACAAGC CAAGAAG GCC 114 0 



TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

T CCAGCAT GAGCGAGGT GCAC AC C GAT GAGC C T GAGGACTT T AT T T C CAAG GTCTTCTTT 1200 

GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAC C CAT GT T CTT ACCAGT GC CT GGAGAACT GT GGG GCT GT ACT C CT GAC AGT G GT GAGG 1260 

AAAGGGGGAGACAT GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGAT GGT T CT GC C 1320 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 
AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GTGGACT ACAAAACAGAGGAT GGTTCT GCC 1320 

AAT GCAGGGGCT GACTAT GAGTT CACAGAGGGCACGGT GGTT CT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

AAT GCAGGGGCT GACTAT GAGTT CAC AGAG GGCACGGT GGT T CT GAAGC C AGGAGAGAC C 1380 

CAGAAGGAGTTCT C CGT GGGCATAATT GAT GAC GACATTTTTGAGGAGGAT GAACACTTC 144 0 
I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAGAAGGAGT T CT C CGT GG GCAT AAT T GAT GAC GAC ATTTT T GAGGAGGAT GAACACT T C 144 0 

TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTT GT AAGGT T GAGCAAT GT C C G CAT AGAGGAGGAGCAGC CAGAGGAGGGGAT G CCT CCA 1500 

GC7\ATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

GTT ACCAT CTT GGATGAT GAC CAT GCAGGCAT CTT CACTTTT GAAT GT GAT ACT ATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GT T AC CAT CT T GGAT GAT GAC CAT GC AGGC AT CT T CACT T TT GAAT GTGATACTAT T CAT 162 0 

GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 168 0 

ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AC AGT CAT CGTCCCCTT TAGGACAGTAGAAGG GAC AGC CAAG GGT G GCGGT GAG GACTTT 1740 

GAAGACAC AT AT GGGGAGT T GGAATT CAAGAAT GAT GAAACT GTAT GT GACAGACAGGAA 1800 
I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I II I I 
GAAGACAC AT AT GGGGAGT T GGAAT T CAAGAAT GAT GAAACT GTAT GT GACAGACAGGAA 1800 

GCT GACT AT GGAAGAAGAGGAG GCCAAGAG GAT AGC AGAGAT GGGAAAG C CAGTATT GGG 18 60 

I I I I I II I I I I I II I I I I II II I I I I I I I I I II I I I I I II I I I I I I I I I I I I M II I I I I 

G CT GACT AT GGAAGAAGAGGAGGCCAAGAGGAT AG C AGAGAT G GGAAAGC CAGT AT T GGG 1860 



I I 



RESULT 2 
AF510503 

LOCUS AF510503 5146 bp mRNA linear PRI 30-OCT-2002 

DEFINITION Homo sapiens Na+/Ca2+ exchanger isoform 3 splice variant 4 (SLC8A3) 

mRNA, complete cds ; alternatively spliced. 
ACCESSION AF510503 

VERSION AF510503.1 GI : 24421224 

KEYWORDS 

SOURCE Homo sapiens (human) 

ORGANISM Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
REFERENCE 1 (bases 1 to 5146) 

AUTHORS Gabellini,N. , Bortoluzzi, S . , Danieli,G.A. and Carafoli,E. 
TITLE The human SLC8A3 gene and the tissue-specific Na(+)/Ca(2+) 

exchanger 3 isoforms 
JOURNAL Gene 298 (1), 1-7 (2002) 
MEDLINE 22294016 
PUBMED 12406570 
REFERENCE 2 (bases 1 to 5146) 

AUTHORS Gabellini,N. , Bortoluzzi , S . , Danieli,G.A. and Carafoli,E. 
TITLE Direct Submission 

JOURNAL Submitted ( 09-MAY-2 002 ) Department of Biology, Unv. of Padova, via 
G. Colombo, Padova, PD 35131, Italy 
FEATURES Location/Qualifiers 
source 1. .5146 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon: 9606" 

/ chromosome=" 14 " 

/map="14q24.2" 
gene 1. .514 6 

/gene="SLC8A3" 
5'UTR 1. .754 

/gene="SLC8A3" 
CDS 755. .2617 

/gene="SLC8A3" 

/note="NCX3. 4 ; expressed in skeletal muscle; alternatively 

spliced" 

/ codon_start=l 

/product="Na+/Ca2+ exchanger isoform 3 splice variant 4" 
/protein_id="AAN607 92 .1" 
/db_xref="GI : 24421225" 

/ 1 r ans 1 a t i on= "MAWLRLQPLTSAFLHFGL VTFVLFLNGLRAEAGGS GDVPSTGQN 
NESCSGSSDCKEGVILPIWYPENPSLGDKIARVIVYFVALIYMFLGVSIIADRFMASI 
EVITSQEREVTIKKPNGETSTTTIRWNETVSNLTLMALGSSAPEILLSLIEVCGHGF 
I AGDLGP STI VGSAAFNMFI 1 1 GI CVYVI PDGETRKI KHLRVFFITAAWS I FAYIWLY 
MIIJVVFSPGWQWEGLLTLFFFPVCVLIAWVADKRLLFYKYMHKKYRTDKHRGIIIE 
TEGDHPKGIEMDGKMMNSHFLDGNLVPLEGKEVDESRREMIRILKDLKQKHPEKDLDQ 
LVEMAN Y YAL S HQQ KS RAF YRI QAT RMMT GAGN I LKKHAAEQAKKAS SMS EVHT DE P E 
DFISKVFFDPCSYQCLENCGAVLLTWRKGGDMSKTMYVDYKTEDGSANAGADYEFTE 
GTWLKPGETQKEFSVGIIDDDIFEEDEHFFVRLSNVRIEEEQPEEGMPPAI FNSLPL 
P RAVLAS P CVAT VT I LDDDHAGI FT FEC DT I HVS ESI GVMEVKVL RT S GARGT VI VP F 
RTVEGTAKGGGEDFEDTYGELEFKNDETVCDRQEADYGRRGGQEDSRDGKASIG" 
3 1 UTR 2618. .5146 



polyA_signal 
ORIGIN 



/gene="SLC8A3" 
5117. .5122 
/gene="SLC8A3" 



Query Match 99.9%; Score 1861.4; DB 9; Length 5146; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1862; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 



Qy 


1 


ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 


60 




i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i t i i i i i i i i i i i i i i i i i i i i i i i i i i 

1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 




Db 


755 


ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 


814 


Qy 


61 


TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 


120 




i i i i i i i i i i i i i i i t i i i i * i i i i i i i i i i ( i i i i i i i i i i 1 1 I 1 1 1 

I | | 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


815 


TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 


874 


Qy 


121 


AC AG GGC AGAAC AAT GAGT C CT GT T C AGG GT CAT C G GACT GC AAGGAG GGT GT CAT C CT G 


180 




• * * * ■ • i i i i i i * i i i i i i t i i i i i i l i i i i i i i i i i i i i i i i i 1 1 t I I I I i 1 I 

1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


875 


AC AGGGCAGAACAAT GAGT C CT GT T C AGGGT CAT CGGACT GCAAGGAGGGT GT CAT C CT G 


934 


Qy 


181 


CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 


240 




i > * * > i > i i i i i i l i i i i i i i i i i i i i i i i i I I i L I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 t ( 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


935 


CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 


994 


Qy 


241 


TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 


300 




■ ■a itiii i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i t i i i i i i i i i i i i i i i i 

1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


995 


TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 


1054 


Qy 


301 


TCT ATT GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 


360 




■ i i i i i ■ i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 
I M 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 




Db 


1055 


T CT ATT GAAGT CAT C AC CT CTCAAGAGAGGGAGGT GACAAT T AAGAAAC C CAAT GGAGAA 


1114 


Qy 


361 


AC C AGC ACAAC CACT AT T C G GGT CT GGAAT GAAACT GT CT C CAAC CT GAC C CT TAT G GCC 


420 




■ i i i i i i i i i • i i i i i i i i i i i i i i i i i i i i i i i i i i i i i > i i i i i i i i i i i i i i i i i i i 
I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 




Db 


1115 


ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 


1174 


Qy 


421 


CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 


480 




i i i ■ i i i i i i i i i i ■ i i i i i i i i i ■ i i i i i i i i i i i i i i i i i i i i i i i i i i i i 

1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1175 


CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 


1234 


Qy 


481 


AT T GCT GGT GAT CT G GGAC CTT CT AC CAT T GT AGGGAGT GCAGC CT T CAACAT GTT CAT C 


540 




I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1235 


AT T GCT GGT GAT CT GGGAC CTT CT AC CAT T GT AGGGAGT GCAGC CT T CAACAT GTT CAT C 


1294 


Qy 


541 


AT CATT GGCATCT GT GTCTACGTGAT CCCAGACGGAGAGACT CGCAAGAT CAAGCAT CTA 


600 




I | | | | | | | I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1295 


AT CATT GGCAT CT GT GT CTACGT GAT CC CAGACGGAGAGACT CGCAAGAT CAAGCAT CTA 


1354 


Qy 


601 


CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 


660 




I I I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1355 


CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 


1414 


Qy 


661 


CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 


720 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1415 


CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 


1474 



Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1475 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1534 

Qy 781 AT G C AC AAAAAGT AC C G C AC AG AC AAAC AC C GAG G AAT TAT CAT AG AG AC AG AG G GT G AC 840 

I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1535 AT GCACAAAAAGTAC CGCACAGACAAACACCGAGGAATTAT CATAGAGACAGAGGGTGAC 1594 

Qy 841 CAC C CT AAGGGCAT T GAGAT GGAT GGGAAAAT GAT GAAT T C C CAT T TT CT AGAT GG GAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1595 CAC C C TAAGGGCATT GAGAT G GAT GGGAAAAT GAT GAAT T C C CAT TTT CTAGAT GG GAAC 1654 

Qy 901 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTCTC 960 

I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I 
Db 1655 CT GGT GC C C CT G GAAGGGAAGGAAGT GGAT GAGT C CC G CAGAGAGAT GAT C C GGAT T CT C 1714 

Qy 961 AAGGAT CT GAAGCAAAAACAC CCAGAGAAGGACTTAGAT CAGCT GGTGGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1715 AAGGAT C T GAAGCAAAAACAC C CAGAGAAG GACTT AGAT CAGCT GGT G GAGAT GGC CAAT 1774 

Qy 1021 T ACT AT GCT CT TT C C CAC C AAC AGAAGAGC C GC GC CT T CT AC C GT AT C C AAGC C AC T C GT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I 

Db 1775 TACT AT GCT CT T T C C CAC CAAC AGAAGAGCC GT GC CT T CTAC C GTATC CAAGC CACT C GT 1834 

Qy 1081 AT GAT GACT GGT GCAGGCAATATCCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1835 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGC C 1894 

Qy 1141 T C C AGCAT GAGC GAGGT GC ACACC GAT GAGC CT GAGGACTT TAT T T CCAAGGT CT T CT TT 1200 

II Ill I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1895 T CC AGCAT GAGC GAGGT GCACACC GAT GAG C CT GAG GACTT TAT T T CCAAGGT CT T CT T T 1954 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1955 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 2 014 

Qy 1261 AAAGGGGGAGACAT GTCAAAGACCAT GTAT GTGGACTACAAAACAGAGGAT GGTT CTGCC 1320 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2015 AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GT G GACT ACAAAACAGAGGAT GGT T CT G CC 2074 

Qy 1321 AAT GCAGGGGCTGACTAT GAGTTCACAGAGGGCACGGT GGTTCT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2075 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 2134 

Qy 1381 CAGAAGGAGTTCTCCGT GGGCATAATT GAT GACGACATTTTTGAGGAGGAT GAACACTTC 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 2135 CAGAAGGAGTT CT CCGTGGGCATAATT GAT GACGACATTTTTGAGGAGGAT GAACACTTC 2194 

Qy 1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2195 T TT GT AAGGT T GAGCAAT GT C CGC AT AGAG GAGGAG CAGC C AGAGGAGGGGAT GC CT C CA 2254 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I II I I I 
Db 2255 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 2314 

Qy 1561 GT T AC CAT CT T GGAT GAT GAC CAT G C AGG C AT CT T C ACT T T T GAAT GT GAT ACT AT T CAT 1620 



1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2315 GTTAC CATCTTGGAT GAT GACCATGCAGGCAT CTT CACTTTT GAAT GT GATACTATTCAT 2374 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2375 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 2434 

Qy 1681 AC AGT CAT C GT C CCC T TT AGGACAGTAGAAGGGAC AGC CAAG GGT GGC GGT GAGGACTT T 1740 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2435 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 2494 

Qy 1741 GAAGACACAT AT GGG GAGT TG GAAT T CAAGAAT GAT GAAACT GT AT GT GACAGAC AGGAA 18 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2495 GAAGACACAT AT GG GGAGT T G GAATT CAAGAAT GAT GAAACT GT AT GT GACAGAC AGGAA 2554 

Qy 1801 GCT GACTAT GGAAGAAGAG GAGGCCAAGAGGAT AG CAGAGAT GGGAAAGCCAGT AT T G GG 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2555 GCTGACTATGGAAGAAGAGGAGGCCAAGAGGATAGCAGAGATGGGAAAGCCAGTATTGGG 2 614 

Qy 1861 TGA 1863 

I 1 I 

Db 2615 TGA 2617 
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DNA 
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Homo sapiens 
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1 

Hilbun,E. and Friddle,C.J. 
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Patent: WO 02059316-A 1 01-AUG-2002; 
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1. .2766 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db xref="taxon:9606" 



ORIGIN 



Query Match 95.8%; 
Best Local Similarity 98.5%; 
Matches 1813; Conservative 



Score 1784.6; DB 6; 
Pred. No. 0; 
0; Mismatches 24; 



Length 2766; 
Indels 4; Gaps 



l; 



Qy 

Db 



1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I II I I II II I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 



Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 AC AGGG CAGAAC AAT GAGT C CT GT T CAGGGT CAT C GGACT G C AAGGAG GGT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 ACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTG 180 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I II 1 I I I I I I I I II 
Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 T CT ATTGAAGT CAT CACCTCT CAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 360 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 T CT ATT GAAGT CAT CACCTCT CAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 360 

Qy 361 AC C AGC ACAAC CACT AT TCGGGTCTG GAAT GAAACT GT C T C C AAC CT G AC C CT T AT GGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 ACC AGCACAAC CACT AT T CG GGT CT GGAAT GAAACT GT CT C CAAC CT GAC C CTT AT GG C C 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 AT T GCT GGT GAT CT GGGAC CT T CT AC CAT T GT AGG GAGT GCAGC CT T C AACAT GT T CAT C 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 54 0 

Qy 541 AT C ATT GGC AT CTGT GT C T AC GT GAT C C CAGACGGAGAGACT CGCAAGAT CAAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 AT C ATTGGCAT CTGT GT CT AC GT GAT C C CAGACGGAGAGACT C GCAAGAT CAAGCAT CT A 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 601 C GAGT CTT CTT CAT CAC C GCT GCT T GGAGT AT CT TTGC CT ACAT CT GGCT CTAT ATGATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I 11 I I I I I I I III I I I I I I I I I I t II I I I I I I I I I I I I I I I I I I I I I I 
Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 8 40 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 AT GCACAAAAAGT ACCGC ACAGACAAACAC C GAGGAAT TAT CAT AGAGAC AGAGGGT GAC 84 0 

Qy 841 CAC CCTAAGGGCATT GAGAT GGAT GGGAAAATGAT GAATTCCCATTTTCTAGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 CAC CCTAAGGGCATT GAGAT GGAT GGGAAAATGAT GAATTCCCAT TTTCTAGAT GGGAAC 900 

Qy 901 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTCTC 960 

I I I I I I I I I I I I I I I I II I I I I I I I I I I II II I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 CTGGTGCCCCT GGAAGG GAAGGAAGT GGAT GAGT C CC GCAGAGAGAT GAT C C GGATT CT C 960 



Qy 961 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCTGGTGGAGATGGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 AAGGAT CT GAAGCAAAAAC AC C CAGAGAAGGACT T AGAT C AGCT GGT G GAGAT GGC CAAT 1020 

Qy 1021 TACT AT GCTCTTTCC CAC CAACAGAAGAGC C GC GC CT T C T AC C GT AT C C AAGC C ACT C GT 1080 

I I I I I M II I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

Qy 1081 AT GAT GAC T G GT G C AG G CAAT AT C C T G AAG AAAC AT G C AG C AG AAC AAG C C AAG AAG G C C 1140 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 AT GAT GACT GGT GCAGGCAAT AT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

Qy 1141 T C C AG CAT GAGC GAG GT G CAC AC C GAT GAGC CT GAGGACT T TAT T T C C AAGGT C T T CTT T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 T CCAGCAT GAGCGAGGTGCACACCGAT GAGCCT GAGGACTTTATTT CCAAGGTCTT CTTT 1200 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

Qy 12 61 AAAGGGG GAGAC AT GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAG GAT GGT T CT GC C 132 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 12 61 AAAGGGG GAGAC AT GT CAAAGAC CAT GT AT GT GG ACTACAAAACAGAGGAT GGT T CT GC C 1320 

Qy 1321 AAT GCAGGGGCTGACTAT GAGTT CACAGAGGGCAC GGT GGTT CT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 AAT GCAGGGGCT GAC TAT GAGT T CAC AGAG GGC AC G GTGGT T CT GAAGC CAGGAGAGACC 1380 

Qy 1381 C AGAAG GAGT TCTCCGTGGG CAT AAT T GAT GAC GAC AT T T T T GAG GAG GAT GAAC AC T T C 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 CAGAAGGAGTTCTCCGTGGGCATAATTGATGACGACATTTTTGAGGAGGATGAACACTTC 144 0 

Qy 1441 TT T GT AAGGTT GAG CAAT GT C C GCAT AGAGGAGGAGCAGC C AGAGGAGGGGAT GC C TCCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 TT T GT AAGGT T GAG CAAT GT C C GCAT AGAGGAGGAGCAGC CAGAGGAGG GGAT GC CT CCA 1500 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 1501 GCAATATTC7VACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

Qy 1561 GTTACCAT CTT GGAT GAT GAC CAT GCAGGCAT CTT CACTTTT GAAT GT GATACTATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 GT T AC CAT CTT GGAT GAT GAC CAT GCAGGCAT CT T C ACTT T T GAAT GT GAT ACT AT T CAT 1620 

Qy 1621 GT CAGT GAGAGT AT T GGT GT TAT GGAGGT CAAG GT TCT GC G GACAT C AG GT GC C C GGGGT 1680 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 GT CAGT GAGAGT AT T G GT GT TAT GGAGGT CAAG GT T CT GC GGACAT C AG GTGCCCGGGGT 1680 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

Qy 1741 GAAGAC AC AT AT G GGGAGTT GGAATT CAAGAAT GAT GAAACT GTAT GT GACAGAC AGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1741 GAAGACACATATGGGGAGTT GGAATT CAAGAAT GAT GAAAC T GT GAAAAC CAT AAG 17 9 6 



Qy 1801 GCT GACT AT G GAAGAAGAGGAGG C CAAGAGGAT AGCAGAGA 1841 

III I I I I I I I I II I I I I I I I I I I 

Db 1797 GGT T AAAAT AGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGA 1837 



RESULT 4 
AX496815 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

FEATURES 

source 



ORIGIN 



linear PAT 26-SEP-2002 



AX496815 3812 bp DNA 

Sequence 5 from Patent WO02059316. 
AX496815 

AX496815.1 GI: 23342337 



Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Hilbun,E. and Friddle,C.J. 

Human ion exchanger proteins and polynucleotides encoding the same 
Patent: WO 02059316-A 5 01-AUG-2002; 
LEXICON GENETICS INC (US) 

Location/Qualifiers 

1. .3812 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db xref="taxon:9606" 



Query Match 95.8%; 
Best Local Similarity 98.5%; 
Matches 1813; Conservative 



Score 1784.6; 
Pred. No. 0; 
0; Mismatches 



DB 6; Length 3812; 



24; Indels 



4; Gaps 



l; 



Qy 



Db 



618 



ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I II I I I I 
ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 677 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
678 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 737 

121 ACAGGGCAGAACAAT GAGT CCT GTTCAGGGT CAT CGGACTGCAAGGAGGGTGT CATCCTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

738 ACAGGGCAGAACAAT GAGT CCT GT T C AGGGT CAT C GGACT G CAAGGAGGGT GT CATC CT G 797 

181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 
I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

798 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 857 

241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
858 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 917 

301 T CT AT T GAAGT CAT C AC C T CT CAAGAGAGGGAGGT GAC AAT T AAG AAAC C C AAT G GAGAA 360 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
918 TCTATTGAAGTCATCACCTCTCAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 977 



Qy 



361 



ACCAGC ACAAC CACTATT C GGGT CT GGAAT GAAACT GT CT C CAAC CT GAC C CT TAT G GCC 420 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

978 AC CAGCACAAC CACTAT TCGGGTCTG GAAT GAAACT GT CT C CAACCT GAC C CTT AT G GC C 1037 

421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I II I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1038 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 1097 



481 



540 



ATT G CT GGT GAT CT GGGACCT T CT AC CATT GTAG GGAGT GC AGC CTT CAACAT GT T CAT C 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1098 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 1157 



541 



600 



AT CATT GG CAT CT GT GT CT AC GT GAT CC CAGAC GGAGAGACT C GCAAGAT CAAGCAT CTA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

1158 AT C ATT GGCAT CT GT GT CT AC GT GAT C C CAGACGGAGAGACTC GCAAGAT CAAGCAT CTA 1217 



601 



660 



CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 
I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1218 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1277 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 
I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1278 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1337 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1338 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1397 

7 81 AT G C AC AAAAAGT AC C G C AC AGAC AAACAC C GAG GAAT TAT C AT AGAGAC AGAG GGT GAC 840 

I I I I I I I I II I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I 

1398 ATGCACAAAAAGT ACCGCACAGACAAACACCGAGGAATTAT CATAGAGACAGAGGGT GAC 1457 

841 CAC C CTAAGGGCAT T GAGAT G GAT GGGAAAAT GAT GAATT C C C AT TT T CT AGAT GGGAAC 900 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

1458 CAC CCTAAGG GCATT GAGAT G GAT GGGAAAAT GAT GAATT C C CAT TT T CT AGAT GGGAAC 1517 



901 



960 



CTGGTGCCCCT GGAAGGGAAG GAAGT GGAT GAGT C CC GCAGAGAGAT GAT C C GGATT CT C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
1518 CTGGTGCCCCT GGAAG GGAAGGAAGT GGAT GAGT C C C GCAGAGAGAT GAT C C GGATT CT C 1577 

961 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTT AGATCAGCT GGT GGAGATGGCCAAT 1020 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1578 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCT GGT GGAGATGGCCAAT 1637 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCT^AGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
1638 TACT AT GCT CT T T C CC AC CAACAGAAGAGC C GCGCCT T CT AC C GTAT C CAAGCCACT C GT 1697 

1081 AT GAT GACT GGT GCAGG CAAT AT C CT GAAGAAAC AT GCAGCAGAACAAGC CAAGAAGGC C 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AT GATGACT GGT GCAGGCAATAT C CT GAAGAAAC AT GCAGCAGAACAAGC CAAGAAGGC C 1757 



1698 



1141 T CC AGC AT GAGCGAGGT GCACAC C GAT GAG C CT GAGGACT T TAT T T C CAAGGT CT T CT T T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1758 T CCAGCAT GAGCGAGGT GCACAC C GAT GAGC CT GAGGACT T TAT T T C CAAG GTCTTCTTT 1817 

1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 
I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 



Db 



1818 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1877 



Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1261 AAAGG GGGAGAC AT GT CAAAGAC CAT GT AT GT G GAC T ACAAAACAGAGGAT G GT TCT GC C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1878 AAAG GGGGAGAC AT GT CAAAGAC CAT GTAT GT GGACT AC AAAACAGAGGAT GGT T CT GC C 1937 

1321 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 13 8 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1938 AAT GC AGGGG CT GACT AT GAGTT CAC AGAGGGCAC G GT GGT TCT GAAGC CAGGAGAGAC C 1997 

1381 C AGAAGGAGT T CT C C GT GGGC AT AAT T GAT GAC GAC AT T T T T GAGGAGGAT GAAC AC T T C 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1998 CAGAAGGAGTTCTCCGT GGGCATAATT GAT GACGACATTTTTGAGGAGGAT GAACACTTC 2057 

1441 TTT GT AAGGTT GAGCAAT GT CCGCAT AGAGGAGGAGCAGCCAGAGGAGGGGAT GCCT C CA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
2058 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 2117 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I i I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2118 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 2177 

1561 GTT AC C AT CT T G GAT GAT GAC CAT GC AGGC AT CT T CACT T T T GAAT GT GAT ACT ATT CAT 162 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2178 GTTACCATCTTGGATGATGACCATGCAGGCATCTTCACTTTTGAATGTGATACTATTCAT 2237 

1621 GTC AGT GAGAGT AT T GGT GT T AT GGAG GT CAAGGTT CT GC GGAC AT CAGGT GCC CGG GGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2238 GTC AGT GAGAGT AT T G GT GT TAT GGAG GT CAAGGT T CT GC G GAC AT CAGGTGCCCGGGGT 2297 

1681 AC AGT CAT CGTCCCCTT TAG GAC AGT AGAAG G G ACAG C C AAGG GT GG C G GT GAG GAC TTT 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I 

22 98 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 2357 

1741 GAAGACACAT AT GG GGAGTT G GAAT T CAAGAAT GAT GAAACTGT AT GT GACAGACAGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I II I 

2358 GAAGACACAT AT G G G G AGT T G GAAT T CAAGAAT GAT G AAAC T GT GAAAAC C AT AAG 2413 

1801 GCT GAC TAT G GAAGAAGAGGAGG C CAAGAGGAT AGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 

2414 GGT T AAAAT AGT AGAT GAGGAG GAAT AC GAAAGG C AAGAGA 2454 



RESULT 5 

HSNCX22 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



HSNCX22 2534 bp DNA linear PRI 12-NOV-2000 

Homo sapiens partial SCL8A3 gene for solute carrier family 8 
(sodium/ calcium exchanger), member 3 (SCL8A3) , exon 2. 
X93017 

X93017.1 GI:1067133 

SLC8A3 gene; sodium- calcium exchanger. 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Kraev,A. , Chumakov, I . and Carafoli,E. 



TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 
TITLE 
JOURNAL 



COMMENT 
FEATURES 

source 



gene 



The organization of the human gene NCX1 encoding the sodium- calcium 
exchanger 

Genomics 37 (1), 105-112 (1996) 

97079665 

8921376 

2 (bases 1 to 2534) 
Kraev, A. S . 
Direct Submission 

Submitted ( 14-NOV-1995 ) A.S. Kraev, Swiss Federal Institute of 
Technology, Laboratory of Biochemistry III, Universitaetstr . 16, 
Zurich, CH-8092, SWITZERLAND 
Similar to X91213. 

Location/ Qualifiers 

1. .2534 

/organism="Homo sapiens 11 
/mol_type=" genomic DNA" 
/db_xref="taxon: 9606" 
/ chromosome="14 " 
/map="q24.1" 
/cell_line="WI38" 
/cell_type=" fibroblast" 
/tissue_type="lung" 

/clone_lib="Stratagene genomic #946204" 

281. .2126 

/gene="SLC8A3" 

281. .2126 

/gene="SLC8A3 " 

/product="solute carrier family 8 ( sodium/ calcium 
exchanger) , member 3" 
/number =2 



ORIGIN 



Query Match 95.8%; 
Best Local Similarity 99.9%; 
Matches 1785; Conservative 



Score 1784.4; DB 9; 
Pred. No. 0; 
0; Mismatches 1; 



Length 2534; 
Indels 0; Gaps 



0; 



Qy 



Db 



343 



ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 
I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 402 



Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
403 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 4 62 

121 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGT CAT CGGACTGCAAGGAGGGT GT CAT CCT G 18 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

463 ACAGG G C AGAACAAT GAGT CCT GTT CAGGGT CAT C GGAC T GCAAGGAG GGT GT CAT CCT G 522 

181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

523 C CAAT CT G GT AC C CGGAGAACC C TT C CCT T GGG GACAAGATT GC CAGGGT CAT T GT CT AT 582 

241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

583 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 642 



Qy 



301 



T CT AT T GAAGT CAT C ACCT CT CAAGAGAGGGAGGT GACAATTAAGAAAC C CAAT GGAGAA 360 



Db 643 TCTATTGAAGT CAT CACCT CTCAAGAGAGGGAGGT GACAATTAAGAAACCCAATGGAGAA 702 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 703 ACCAGCACAACCACTATTCGGGTCTGGT^ATGAAACTGTCTCCAACCTGACCCTTATGGCC 7 62 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 763 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 822 

Qy 4 81 AT T GCT GGT GAT CT GGGACCTT CT AC CAT T GT AGGGAGT GC AG C CTT CAACAT GT T CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 823 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 882 

Qy 541 AT CAT T GGC AT CT GT GT CT AC GT GAT CC C AGAC GGAGAGACT C GCAAGAT CAAGC ATCT A 600 

I I I I I 1 1 II I I I I I 1 1 I 1 1 I 1 1 1 1 1 I 1 1 1 1 I I I I I I 1 1 1 1 1 I 1 1 1 1 I I I I I 1 1 1 I I I i 1 1 

Db 8 83 AT CAT TGGCAT CTGT GTCTACGTGAT CCCAGACGGAGAGACT CGCAAGAT CAAGCATCT A 942 

Qy 601 C GAGT CTT CT T CAT C AC C GCT G CTT GGAGT AT CTT T GC CTAC AT CT GG CT CT AT AT GAT T 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 943 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1002 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1003 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1062 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1063 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1122 

Qy 781 AT GCACAAAAAGTACCGCACAGACAAACACC GAGGAATT AT CAT AGAGACAGAGGGT GAC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1123 AT GCACAAAAAGTACCGCACAGACAAACACC GAGGAATT AT CAT AGAGACAGAGGGT GAC 1182 

Qy 841 CACC CT AAGGGC AT T GAGAT GGAT G GGAAAAT GAT GAAT T CC CAT T TT CTAGAT GGGAAC 900 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1183 CACC CTAAGGGC AT T GAGAT GGAT GGGAAAAT GAT GAAT T C C CAT T TT CTAGAT GGGAAC 1242 

Qy 901 CT GGT GCC CCT G GAAGGGAAGGAAGT GGAT GAGT CCCG C AGAGAGAT GAT C C GGAT T CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1243 CT GGT GC C C CT GGAAGG GAAGGAAGT GGAT GAGT C C C GCAGAGAGAT GAT CC GGAT TCT C 1302 

Qy 961 AAGGAT CT GAAGCAAAAACACC C AGAGAAGGACTT AGAT CAGCT GGT GGAGAT GG C CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1303 AAG GAT CT GAAGCAAAAACAC C CAGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGC CAAT 1362 

Qy 1021 TACT AT GCTCTTTCC C AC C AAC AGAAGAGC C GC GC CT T CTAC C GT AT C C AAGC C ACT C GT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1363 T ACT AT GC T CT T T C C CAC CAACAGAAGAGCC GCGC CTT CT AC CGT AT C CAAGC CACT C GT 1422 

Qy 1081 ATGATGACTGGTGCAGGCAATATCCTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 1423 AT GAT GACT G GT GCAGG CAAT AT CCT GAAGAAAC AT GC AGC AGAACAAGCCAAGAAGGC C 14 82 

Qy 114.1 T C C AG CAT GAG C GAG G T G CAC AC C GAT GAG CCT GAG GAC T T T AT T T C C AAG GTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



1483 T C CAGCAT GAGC GAG GT GCAC AC C GAT GAGC CT GAGGAC T T TATT T CCAAGGT CTT CT T T 1542 



Qy 12 01 GAC C CAT GT T CT T AC CAGT GC CT GGAGAACT GTGGGGCT GT ACT C CT GACAGT G GT GAG G 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1543 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1602 

Qy 12 61 AAAGG GGGAGACAT GT CAAAGAC CAT GT AT GT GGACTACAAAACAGAGGAT G GTT CT GC C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1603 AAAGG GGGAGACAT GT CAAAGAC CAT GT AT GT GGACT ACAAAAC AGAG GAT G GT T CTGC C 1662 

Qy 1321 AAT G C AGGGGCT GAC TAT GAGTT CACAGAGGGCAC GGT GGTT CT GAAGC CAGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1663 AAT G C AGG G GC T GAC TAT GAGT T CACAGAGGGCAC G GT GGTT C T GAAGC CAGGAGAGAC C 1722 

Qy 1381 C AGAAG GAGT TCTCCGTGGG CAT AAT T GAT GAC GAC AT T T T T GAG GAG GAT G AAC AC T T C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1723 CAGAAGGAGTTCTC CGT GGGCATAATTGATGACGACATTTTT GAGGAGGAT GAACACTT C 1782 

Qy 14 41 T T T GT AAG GT T GAG C AAT GT C C GC AT AGAGGAGGAG C AGC CAGAGGAGG GGAT G C CT C CA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1783 TTT GT AAG GTT GAG CAAT GT C C GC AT AGAGGAGGAGCAGCCAGAGGAGGGGAT GC CTC CA 1842 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 18 4 3 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1902 

Qy 1561 GT T AC CAT CTT GGAT GAT GAC C AT GC AG G CAT CTT C ACT T T T GAAT GT GAT ACT AT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1903 GTTACCAT CTT GGAT GAT GAC CAT GCAGGCAT CTT CACTTTT GAAT GT GATACTATTCAT 1962 

Qy 1621 GTCAGTGAGAGTAT T GGTGTTATGGAGGT CAAGGTT CT GCGGACAT CAGGTGCCCGGGGT 1680 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1963 GTCAGTGAGAGTAT T GGT GTTATGGAGGT CAAGGTT CT GCGGACAT CAGGTGCCCGGGGT 2022 

Qy 1681 AC AGT CAT CGT C CC C TTT AGGACAGTAGAAGG GAC AGC CAAG GGT G GCGGT GAGGACT T T 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2023 ACAGT CAT C GT C C C C TT T AGGACAGTAGAAGG GACAGC CAAGGGT GGC GGT GAGGACT T T 2082 

Qy 1741 GAAGACAC ATAT GGG GAGT T GGAAT T CAAGAAT GAT GAAACT GTAT 1786 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2083 GAAGACACAT AT GGGGAGT T G GAAT T CAAGAAT GAT GAAACT GT GT 2128 
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AX299471 
Sequence 
AX299471 
AX299471. 



2781 bp 
1 from Patent WO0183744. 

1 GI:17129228 



DNA 



linear PAT 26-NOV-2001 



(human) 



Homo sapiens 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 

Wilm, C. 

Natrium-calcium exchanger protein 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



FEATURES 

source 



CDS 



JOURNAL Patent: WO 0183744-A 1 08-NOV-2001; 
MERCK PATENT GmbH (DE) 

Location/Qualifiers 
1. .2781 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db_xref="taxon: 9606" 
1. .>2781 

/note="unnamed protein product" 
/codon_start=l 
/protein_id="CAD12716. 1" 
/db_xref="GI : 17129229" 
/ db__x r e f = " REMT REMBL : CAD 12716" 

/ translation— "MAWLRLQPLTSAFLHFGLVTFVLFLNGLRAEAGGSGDVPSTGQN 
NESCSGSSDCKEGVILPIWYPENPSLGDKIARVIVYFVALIYMFLGVSIIADRFMASI 
EVITSQEREVTIKKPNGETSTTTIRVWNETVSNLTLMALGSSAPEILLSLIEVCGHGF 
I AGDLGPSTIVGSAAFNMFI 1 1 GICVYVI PDGETRKI KHLRVFFI TAAWS I FAYIWLY 
MI LAVFSPGWQVWEGLLTLFFFPVCVLLAWVADKRLLFYKYMHKKYRTDKHRGI I IE 
TEGDHPKGIEMDGKMMNSHFLDGNLVPLEGKEVDESRREMIRILKDLKQKHPEKDLDQ 
LVEMANYYALSHQQKSRAFYRIQATRMMTGAGNILKKHAAEQAKKASSMSEVHTDEPE 
DFISKVFFDPCSYQCLENCGAVLLTWRKGGDMSKTMYVDYKTEDGSANAGADYEFTE 
GTWLKPGETQKEFSVGIIDDDIFEEDEHFFVRLSNVRIEEEQPEEGMPPAI FNSLPL 
P RAVLAS P CVAT VT I L D D D HAG IFTFECDTI HVS ESI GVMEVKVLRT S GARGT VI VP F 
RTVEGTAKGGGEDFEDTYGELEFKNDETVKTIRVKIVDEEEYERQENFFIALGEPKWM 
ERGISGVRFFKDVTDRKLTMEEEEAKRIAEMGKPVLGEHPKLEVIIEESYEFKTTVDK 
LIKKTNLALWGTHSWRDQFMEAITVSAAGDEDEDESGEERLPSCFDYVMHFLTVFWK 
VL FACVP P TE YCHGWAC FAVS I L 1 1 GMLTAI I GDLAS H FGCT I GLKDS VTAWFVAFG 
T S VP DT FAS KAAALQ D VYADAS I GNVT G S N AVNVFL G I G LAW S VAAI YWALQ GQ E FH V 
SAGTLAFSVTLFTI FAFVCI SVLLYRRRPHLGGELGGPRGCKLATTWLFVSLWLLYI L 
FATLEAYCYIKGF" 



ORIGIN 



Query Match 95.7%; 
Best Local Similarity 98.4%; 
Matches 1812; Conservative 



Score 1783; 
Pred. No. 0; 
0; Mismatches 



DB 6; Length 2781; 
25; Indels 4; 



Gaps 



l; 



Qy 

Db 



ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 



Qy 

Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 12 0 



Qy 

Db 

Qy 

Db 

Qy 

Db 



121 AC AGGG CAGAACAAT GAGT CCT GTT CAGGGT CAT C G GACT GCAAGGAGGGT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
121 AC AGGG CAGAACAAT GAGT CCT GTT CAGGGT CATC GGACTGCAAGGAGGGTGT CAT CCT G 18 0 

181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 C C AAT C T G GT AC C C G G AG AAC CCTTCCCTTGGG G AC AAG AT T G C C AG G GT CAT T GT C TAT 24 0 

241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 



Qy 



301 



T CT AT T GAAGT CAT C AC CT CT CAAGAGAG GGAGGT GACAATTAAGAAAC C CAAT GGAGAA 360 



Db 301 T CTATT GAAGT C ATCACCT CT CAAGAGAGGGAGGTGACAATTAAGAAAC CCAATGGAGAA 360 

Qy 361 AC CAGC AC AAC C ACT AT TCGGGTCTG GAAT GAAACT GT CT C CAAC CT GAC C C T TAT G GC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 42 0 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 48 0 

I I I I I I I I I I I I I I I I I I I II I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 ATT GCT GGT GAT CT GG GAC CT T CT AC CATT GT AGGGAGT GCAGC CTT CAACAT GT T CAT C 54 0 

I II I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 54 0 

Qy 541 AT CAT T G G C AT CT GT GT CT AC GT GAT C C C AGAC GG AG AGAC T C GCAAGAT CAAG CAT CT A 600 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 AT CAT T GG CAT CT GT GT CTAC GT GAT CC CAGAC GGAGAGACT C GCAAGAT CAAGCAT CT A 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 72 0 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 78 0 

Qy 781 AT GCACAAAAAGT AC C G C ACAGACAAAC AC C GAGGAAT TAT C AT AGAGAC AGAGGGT GAC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 781 AT G C ACAAAAAGT AC C G C AC AGAC AAAC AC C GAGGAAT TAT CAT AGAGAC AG AGG GT GAC 840 

Qy 841 CACCCTAAGGGCATTGAGATGGATGGGAAAATGATGAATTCCCATTTTCTAGATGGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 841 CAC CCTAAGGG CAT T GAGAT GGATGGGAAAAT GAT GAAT T CC C ATT T T CT AGAT GG GAAC 900 

Qy 901 CT GGT GCCCCTGGAAGGGAAGGAAGT GGATGAGTCCCGCAGAGAGATGATCCGGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 CT GGT GCCCCTGGAAGGGAAGGAAGT GGAT GAGTCCCGCAGAGAGAT GAT CCGGATT CT C 960 

Qy 961 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCTGGTGGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGATGGCCAAT 1020 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGTGCCTTCTACCGTATCCAAGCCACTCGT 1080 

Qy 1081 AT GAT GACT GGT GCAGGCAAT AT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 AT GAT GACTGGTGCAGGCAATATCCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 



Qy 1141 



T C CAG CAT GAGC GAG GT GCAC AC CGAT GAGCC T GAGGACT TT AT T T C C AAGGT CTT CTT T 
I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I II 



1200 



Db 



1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 12 00 



Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 12 60 

Qy 1261 AAAGGGGGAGACATGT CAAAGAC CAT GT AT GT GGACTACAAAACAGAGGAT GGTT CT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1261 AAAGG GGGAGAC AT GT CAAAGAC CAT GTAT GT G GACTACAAAACAGAGGAT GGT T CT GC C 1320 

Qy 1321 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I 

Db 1321 AAT GC AGGG GCT GAC TAT GAGT T CACAGAGGG CAC GGT GGTT CT GAAGC C AG GAGAGAC C 1380 

Qy 1381 CAGAAGGAGTTCTCCGTGGGCATAATTGATGACGACATTTTTGAGGAGGATGAACACTTC 14 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGAAGGAGTTCT CCGT GGGCATAAT TGAT GACGACATTTTTGAGGAGGATGAACACTT C 144 0 

Qy 1441 TT T GT AAGGT T GAGCAAT GT CC GCAT AGAGGAG GAGCAGC CAGAGGAGGG GAT GC C T C C A 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 15 00 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

Qy 1561 GT T AC CAT C T T G GAT GAT GAC CAT G C AG G CAT C T T CAC T T T T G AAT GT GAT AC TAT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GTTACCATCTTGGATGATGACCATGCAGGCATCTTCACTTTTGAATGTGATACTATTCAT 1620 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 168 0 

Qy 1681 AC AGT CAT CGTCCCCTT TAG GAC AGT AGAAGG GAC AG C C AAG GGTGGCGGT GAG GAC T T T 1740 

111111111111111111111111111111111111111111111111111111111111 
Db 1681 AC AGT CAT C GT C C CCTT T AG GACAGT AGAAGG GACAGCCAAGG GT G GCGGT GAGGACTTT 1740 

Qy 1741 GAAGACAC AT AT GGG GAGT T GGAATT CAAGAAT GAT GAAACT GT ATGT GACAGACAGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I j II I 

Db 1741 GAAGACACATAT GGGGAGTT GGAATT CAAGAAT GAT GAAAC T GT GAAAAC CAT AAG 1796 

Qy 18 01 GCT GACT AT G GAAGAAGAG GAGGCCAAGAGGAT AGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 

Db 1797 GGT T AAAAT AGT AGAT GAGGAGGAAT ACGAAAGGCAAGAGA 18 37 
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AX476818 
Sequence 
AX476818 
AX476818. 



2782 bp 
1 from Patent WO0233086. 

1 GI:22216098 



DNA 



linear PAT 12-AUG-2002 



(human) 



Homo sapiens 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 



Craniata ; Vertebrata ; Euteleos tomi ; 



Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
REFERENCE 1 

AUTHORS Merkulov,G.V. , Ketchum, K. A. , Shao,W., Yan,C, di Francesco, V. and 
Beasley, E.M. 

TITLE Isolated human transporter proteins, nucleic acid molecules 

encoding human transporter proteins, and uses thereof 
JOURNAL Patent: WO 0233086-A 1 25-APR-2002; 
PE Corporation (NY) (US) 
FEATURES Location/Qualifiers 
source 1. .2782 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db_xref="taxon: 9606" 

ORIGIN 

Query Match 95.7%; Score 1783; DB 6; Length 2782; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 1812; Conservative 0; Mismatches 25; Indels 4; Gaps 1; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 10 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 69 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 0 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 129 

Qy 121 ACAGGGCAGAACAAT GAGT C CT GT T C AGGGT CAT CG GACT G CAAGGAGGGT GT CAT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 130 ACAGGGCAGAACAAT GAGT C CT GT T C AGG GT CAT C GGACT GCAAGGAG G GT GT CAT C C T G 18 9 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 190 C CAAT CTGGT AC CCGGAGAACC CT T C C CT T GGGGACAAGAT T GC CAGGGT CATT GT CT AT 24 9 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II I I I I I I I I I I I I I I I I II I I I I 
Db 250 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 309 

Qy 301 T CTAT T GAAGT CAT CACCT CT CAAGAGAGGGAGGTGACAAT TAAGAAAC CCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 310 T CTAT T GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAAT T AAGAAACC CAAT GGAGAA 369 

Qy , 361 ACCAGCACAACCACTATT CGGGTCTGGAAT GAAACT GTCT CCAACCTGACC CTTATGGCC 42 0 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 37 0 ACC AGCACAAC C ACTATT C GG GT CT GGAAT GAAACT GT CT C CAAC CT GACC CTT AT GG C C 429 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 I I I 1 1 1 1 1 1 1 1 1 1 I I I i I I I 1 1 1 1 1 1 1 1 1 I 1 1 I 1 1 I I I I I I 1 1 

Db 430 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 48 9 

Qy 4 81 ATTG CT G GT GAT CT GGGAC CT T CT AC CAT T GT AGGGAGT GC AGC CTT CAAC AT GT T CAT C 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 490 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 549 



Qy 



541 AT CAT T GGCAT CT GT GT CT AC GT G AT CC C AGAC GGAGAGACT C GCAAGAT CAAG CAT CT A 600 
I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II 



Db 550 AT CAT T GGCAT CT GT GT CTAC GT GAT C C CAGAC GGAGAGACT CGCAAGAT CAAGCAT CT A 609 

Qy 601 C GAGT C T T CT T CAT C AC CGCTGCTT GGAGT AT CT T T G C CT AC AT CT G G CT CT AT AT GATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 610 C GAGT CTT CTT CAT CAC C GCT GCT T GGAGT AT CT T T G C CT ACAT CT G GC T C TAT AT GATT 669 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 670 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 72 9 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 730 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 7 89 

Qy 781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I 

Db 790 AT G CACAAAAAGTAC CGC AC AGAC AAAC AC CGAGGAAT TAT CAT AGAGACAGAGGGT GAC 84 9 

Qy 841 CACCCTAAGGGCATTGAGATGGATGGGAAAATGATGAATTCCCATTTTCTAGATGGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 850 CACCCTAAGGGCATT GAGATGGAT GGGAAAAT GAT GAATTCCCATTTT CTAGAT GGGAAC 909 

Qy 901 CTGGTGCCCCT GGAAGGGAAGGAAGT GGAT GAGT CCC GCAGAGAGAT GAT C C GGAT T C T C 960 

I I I I II I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 910 CT GGT GC CCCT GGAAGGGAAGGAAGT GGAT GAGT C CC GCAGAGAGAT GAT C C GGAT C CT C 969 

Qy 961 AAGGAT CT GAAG CAAAAACAC CCAGAGAAGGACTT AGAT CAGCT GGT G GAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 970 AAGGATCT GAAGCAAAAACAC CCAGAGAAGGACTTAGAT CAGCT GGT GGAGATGGCCAAT 1029 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

II I I I I I I I I I I I I I I I I I I I I I I I I I II II I I II I I II I I I I I I I I I I I I I I I I I I I I I 

Db 1030 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 108 9 

Qy 1081 AT GAT GACT GGT GC AGG CAAT AT C CT GAAGAAAC AT G CAGC AGAACAAGCCAAGAAGG CC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1090 AT GAT GACT G GT GCAGG CAAT AT C CT GAAGAAAC AT GCAGCAGAACAAGC CAAGAAGG C C 114 9 

Qy 1141 T C CAG CAT GAGC GAGGT GCACAC C GAT GAGC CT GAGGACT T TAT T T C C AAG GT CT T CT T T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1150 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 12 09 

Qy 12 01 GAC C CAT GT T CT T AC C AGT GC CT GGAGAACT GT G GG GCT GT ACT C CT GACAGT G GT GAGG 1260 

I I I I I I I I I I I I I I I I I I I fl I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1210 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1269 

Qy 12 61 AAAGGGGGAGACAT GTCAAAGAC CAT GTAT GT GGACT ACAAAAC AGAGGATGGTT CT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1270 AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GT GGACT ACAAAACAGAGGAT GGT T CT GCC 1329 

Qy 1321 AAT GCAGGGGCT GACT AT GAGTT CACAGAGGGCACGGTGGTT CT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1330 AAT GC AGGG G CT GACT AT GAGTT CAC AGAG GGCAC GGT GGT T CT GAAGCCAGGAGAGACC 1389 



Qy 

Db 



1381 CAGAAGGAGTT CT CCGT GGGCATAATT GAT GACGACATTTTT GAGGAGGAT GAACACTTC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1390 CAGAAGGAGT T CT C CGT GGGCATAATT GAT GAC GAC AT TT T T GAGGAGGAT GAACACT T C 1449 



Qy 1441 T T T GTAAGGT T GAGCAAT GT C C G CAT AGAGGAG GAGCAGC CAGAGGAGGGGAT G CCT C CA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1450 TT T GTAAGGT T GAGCAAT GT CCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCT CCA 1509 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1510 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1569 

Qy 1561 GT T AC CAT C T T G GAT GAT G AC CAT G C AG G CAT C T T C AC T T T T G AAT GT GAT AC TAT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1570 GT T AC CAT C T T G GAT GAT G AC CAT G C AG G CAT C T T C AC T T T T G AAT GT GAT AC TAT T CAT 1629 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1630 GT C AGT GAGAGT AT T GGT GTTAT GGAG GT CAAG GTT CT GC GGACAT CAGGT GC C CGG G GT 1689 

Qy 1681 ACAGT CAT C GT C C C CTT T AG GAC AGT AGAAGGGACAGC CAAGGGT G GCGGT GAGGAC T TT 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 1690 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1749 

Qy 1741 GAAGAC AC AT AT G GG G AGT T GGAAT T C AAGAAT GAT GAAAC T GT AT GT GAC AG AC AG GAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1750 GAAGACACATAT GGGGAGT T GGAATT CAAGAAT GAT GAAAC T GT GAAAAC CATAAG 1805 

Qy 1801 GCT GACTATGGAAGAAGAGGAGGC CAAGAGGATAGCAGAGA 1841 

III II I I I I II I I I I I I I II I I I 

Db 18 06 GGT T AAAAT AGT AGAT GAG GAG G AAT AC G AAAG G C AAGAGA 1846 
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/protein_id="CAC40985. 1" 
/db_xref="GI : 14330385" 
/db_xref="GOA:Q96QGl" 
/db_xref="SPTREMBL: Q96QG1" 

/translation="MAWLRLQPLTSAFLHFGLVTFVLFLNGLRAEAGGSGDVPSTGQN 
NESCSGSSDCKEGVILPIWYPENPSLGDKIARVIVYFVALIYMFLGVSIIADRFMASI 
EVITSQEREVTIKKPNGETSTTTIRVWNETVSNLTLMALGSSAPEILLSLIEVCGHGF 
IAGDLGPSTIVGSAAFNMFIIIGICVYVIPDGETRKIKHLRVFFITAAWSIFAYIWLY 
MI LAVFS PGWQVWEGLLTLFFFPVCVLLAWVADKRLLFYKYMHKKYRTDKHRGI HE 
TEGDHPKGIEMDGKMMNSHFLDGNLVPLEGKEVDESRREMIRILKDLKQKHPEKDLDQ 
LVEMAN Y YAL S HQQ KS RAF YR I QAT RMMT GAGN I L KKHAAEQ AKKAS SMS E VHT D E P E 
DFISKVFFDPCSYQCLENCGAVLLTWRKGGDMSKTMYVDYKTEDGSANAGADYEFTE 
GTWLKPGETQKEFSVGIIDDDIFEEDEHFFVRLSNVRIEEEQPEEGMPPAIFNSLPL 
P RAVLAS P CVAT VT I LDDDHAGI FT FEC DT I HVS ES I GVMEVKVLRT S GARGTVI VP F 
RTVEGTAKGGGEDFEDTYGELEFKNDETVKTIRVKIVDEEEYERQENFFIALGEPKWM 
ERGI SALLLS PDRKLTMEEEEAKRIAEMGKPVLGEHPKLEVI I EES YEFKTTVDKLI K 
KTNLALWGTHSWRDQFMEAITVS7VAGDEDEDESGEERLPSCFDYVMHFLTVFWKVLF 
ACVP PT E YCHGWAC FAVS I L 1 1 GMLTAI I GDLAS H FGCT I GLKD S VT AWFVAFGT S V 
PDT FAS KAAALQDVYADAS I GNVTGSNAVNVFLGI GLAWSVAAI YWALQGQEFHVSAG 
TLAFSVTLFTIFAFVCISVLLYRRRPHLGGELGGPRGCKLATTWLFVSLWLLYILFAT 
LEAYCYIKGF" 

ORIGIN 



Query Match 95.7%; Score 1783; DB 9; Length 2837; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 1812; Conservative 0; Mismatches 25; Indels 4; Gaps 1; 



Qy 


l 


ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 


60 




I I 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


63 


ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 


122 


Qy 


61 


TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 


120 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 M 1 1 1 1 1 1 1 1 




Db 


123 


TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 


182 


Qy 


121 


ACAGGGCAGAACAAT GAGT C CT GT T C AGGGT CAT CGGACT G CAAGGAGGGT GT CAT C CT G 


180 




I I I I 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 




Db 


183 


ACAGGG CAGAACAAT GAGT C CT GT T CAGGGT CAT CG GACT GCAAGGAG GGT GT CAT C CT G 


242 


Qy 


181 


CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 


240 






I I I I I I I 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


243 


CCAAT CT GGT AC C CGGAGAAC CCTTCCCTT GGGGACAAGAT T G C CAGGGT CAT T GT CT AT 


302 


Qy 


241 


TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 


300 



Db 



303 



I I I I I I I I I I M I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I 

TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 



362 



Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 



301 T CTATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT TAAGAAAC CCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

363 T CT AT T GAAGT CAT CAC CT CT C AAGAGAG GGAGGT GACAAT TAAGAAAC C CAAT G GAGAA 422 

361 ACCAGCACTVACCACTATTCGGGTCTGGAATGTWVCTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

423 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 482 



421 



483 



481 



480 



CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 
I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I | | | | | | | | | | I I I I I I I II I I 
CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 542 



540 



ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

543 ATT GCTGGT GAT CTGGGACCTTCTAC CAT TGTAGGGAGTGCAGCCTTCAACATGTT CATC 602 

541 AT CAT T GG CAT CTGT GT CT AC GT GAT C C C AGAC GGAGAGACT CGCAAGAT CAAGCAT CT A 600 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
603 AT CAT T GGC AT CT GT GT CT AC GT GAT CC CAGAC GGAGAGACT C GCAAGAT CAAGCAT CT A 662 

601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
663 C GAGT CTT CTT C AT CAC CGCTGCTTG GAGT AT CTT T GC CTAC AT CT GG CT CT AT AT GAT T 722 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

723 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 782 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 78 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
783 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 842 

781 AT GC ACAAAAAGT AC C GCAC AGACAAAC AC C GAGGAAT TAT C AT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

843 AT GC ACAAAAAGTAC C GC ACAGACAAACAC C GAGGAATT AT CAT AGAGACAGAGGGT GAC 902 

841 CACCCTAAGGGCATT GAGAT GGATGGGAAAAT GAT GAATT CCCATTTTCTAGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
903 CACCCTAAGGGCATTGAGATGGATGGGAAAATGATGAATTCCCATTTTCTAGATGGGAAC 962 



901 



960 



CT GGT G CC C CT G GAAG GGAAGGAAGT GGAT GAGT C C C GC AGAGAGAT GAT CC G GAT T CT C 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

963 CTGGT GCCCCTGGAAGGGAAGGAAGTGGAT GAGT CCCGC AGAGAGAT GAT CCGGATT CTC 1022 

961 AAGGAT CT GAAGCAAAAAC ACC C AGAGAAG GACT TAGAT CAGCT GGT GGAGAT G GCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | I I I I I I I I I I I I I I I I I I I 

1023 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGT GGAGAT GGCCAAT 1082 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I II II I I I I I I I I I I I I I I I I 
1083 T AC TAT GCT CT T T CC CAC CAACAGAAGAGC C GT GC CT T CT ACC GT AT CCAAGC CAC T C GT 1142 

1081 AT GAT GACT GGTGCAGGCAATAT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 114 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 



Db 


1143 


Qy 


1141 


Db 


1203 


Qy 


1201 


Db 


1263 


Qy 


1261 


Db 


1323 


Qy 


1321 


Db 


1383 


Qy 


1381 


Db 


1443 


Qy 


1441 


Db 


1503 


Qy 


1501 


Db 


1563 


Qy 


1561 


Db 


1623 


Qy 


1621 


Db 


1683 


Qy 


1681 


Db 


1743 


Qy 


1741 


Db 


1803 


Qy 


1801 


Db 


1859 



1143 AT GAT GACT G GT GCAGGC AATAT C CT GAAGAAACAT G CAGCAGAAC AAG C CAAGAAGGCC 1202 

T C C AGC AT GAG C GAGGT G C ACAC C GAT GAGC CT GAGG ACT T TAT T T C C AAGGT CT T CT T T 120 0 

I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

T C C AG CAT GAGC GAG GT GC AC AC C GAT GAG C CT G AGGACT T TAT T T C C AAGGT CT T C T T T 12 62 

GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I 

GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1322 

AAAGG GGGAGACAT GT CAAAGAC CAT GTAT GT G GACT ACAAAACAGAGGAT GGT T CT GC C 132 0 
| | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAAGGGGGAGAC AT GT CAAAGAC CAT GTAT GT GGACT ACAAAACAGAGGAT GGT T CT GC C 1382 

AATGCAGGGGCT GACT AT GAGTT CACAGAGGGCACGGT GGTT CT GAAGC CAGGAGAGAC C 1380 
| | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAT GCAGGGGCT GACT AT GAGTT CACAGAGGGCACGGT GGTTCT GAAGC C AG GAGAGACC 1442 

CAGAAGGAGT T CT C C GT GGGCAT AAT T GAT GAC GAC ATT TTT GAGGAGGAT GAACACTT C 1440 

| | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAGAAGGAGT T CT CC GT GGGCAT AAT T GAT GAC GAC ATT T T T GAG GAGGAT GAACAC TT C 1502 

TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 
| I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTT GTAAGGTT GAGCAAT GT C C GCAT AGAGGAG GAGCAGC CAGAG GAGGG GAT GCCT C CA 1562 

GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1622 

GT T AC CAT CTT GGAT GAT GACCAT GC AGGCAT CTT CACTT TT GAAT GT GATACT AT T CAT 1620 
I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II II II I I I II I I I II I 
GTTACCAT CTT GGAT GAT GACCATGCAGGCAT CTT CACTTTT GAAT GT GATACTATTCAT 1682 

GT CAGT GAGAGT AT T G GT GT T AT GGAGGT CAAGGT T CT G C GGAC AT CAG GTGCCCGGGGT 1680 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GT CAGT GAGAGT ATT GGT GTTATGGAGGT CAAGGTTCT GCGGACAT CAGGT GCCCGGGGT 17 42 

ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 
| | | I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACAGT CAT C GT C CC CT TT AGGACAGT AGAAGG GACAGC CAAGGGT G GC GGT GAG GACTT T 1802 



GAAGACAC AT AT GGGGAGT TGGAAT T C AAG AAT GAT GAAACT GTAT GT GAC AGACAGGAA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I M I 

GAAGACACATAT GG G GAGT T GGAAT TCAAGAAT GAT GAAAC 



1800 



T GT GAAAAC CAT AAG 1858 



III I I I I I I I I I I I I I 



I I I II 



RESULT 9 
AX480881 

LOCUS AX480881 2966 bp DNA linear PAT 12-AUG-2002 

DEFINITION Sequence 41 from Patent WO024 6415. 

ACCESSION AX480881 

VERSION AX480881.1 GI:22217538 



KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

FEATURES 

source 



ORIGIN 



Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleos tomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Lee,E.A., Baughn,M.R., Yue f H., Ding,L., Raumann, B . E . , Haf alia, A. J ♦ , 
Khan, F. A., Nguyen, D.B., Elliott, V. S . , Ramkumar,J., Walia,N.K., 
Ison,C.H., Lu,Y., Gandhi, A. R. , Warren, B. A., Duggan,B.M., 
Tribouley, CM. , Burford,N., Lu,D.A., Lal,P.G., Yao,M. G. , Xu,Y., 
Bruns,C.M., Thangavelu, K. , Swarnakar , A. , Tang,Y.T., Azimzai,Y., 
Thornton, M. , Arvizu,C. and Policky,J.L. 
Transporters and ion channels 
Patent: WO 0246415-A 41 13-JUN-2002 ; 
Incyte Genomics, Inc. (US) 

Location/Qualifiers 

1. .2966 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db_xref="taxon: 9606" 
/note="Incyte ID No: 5923789CB1" 



Query Match 95.7%; 
Best Local Similarity 98.4%; 
Matches 1812; Conservative 



Score 1783; DB 6; 
Pred. No. 0; 
0; Mismatches 25; 



Length 2966; 



Indels 



4; Gaps 



1; 



Qy 



Db 



1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

201 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 260 



Qy 

Db 

Qy 

Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

261 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 320 

121 AC AGGGCAGAACAAT GAGT C CT GTT C AGGGT CAT CGGACT G CAAGGAGGGT GT CAT C CT G 180 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

321 ACAGGGCAGAACAAT GAGT C CT GT TCAGGGT CAT CGGACT GCAAGGAGGGT GT CAT C CT G 380 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



181 CCAAT CT GGT AC C C G GAGAACC CT TC C CT T GGG GACAAGAT T GC CAGGGT CAT T GT CTAT 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

381 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 44 0 

241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I II I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
441 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 500 

301 T CTAT T GAAGT CAT CACCT CT CAAGAGAGG GAGGT GACAATT AAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
501 T CTAT T GAAGTC AT CACCT CT CAAGAGAGGGAG GT GACAAT TAAGAAAC C CAAT GGAGAA 560 

361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
561 AC CAGCACAAC C ACT AT T C G GGT CT GGAAT GAAACT GT CT CCAAC CT GAC C CT T AT G GC C 620 



Qy 



421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 48 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



62 1 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 680 

4 81 AT T GCT G GT GAT CT GG GAC CT T CT AC CAT T GT AG G GAGT GC AGC CT T CAAC AT GT T CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I! 

681 AT T GCT GGT GAT CT GGGAC CTT CT AC C ATT GT AG GGAGT GC AGCCT T CAACAT GT T CATC 74 0 

541 AT CAT T G GCAT CT GT GT CT ACGT GAT C C CAGACGGAGAGACT C GCAAGAT CAAGC AT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
741 AT CAT T G GCAT CT GT GT CT ACGT GAT C C CAGACGGAGAGACT C GCAAGAT C AAGCAT CTA 8 00 

601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I 
801 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 8 60 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
861 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 920 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 7 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
921 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 980 

781 AT GC ACAAAAAGT AC C GCAC AGACAAAC AC C GAGGAAT TAT C AT AGAGAC AGAGGGT GAC 840 

I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

981 AT GCACAAAAAGT AC CGCACAGACAAACAC C GAGGAAT TAT CAT AGAGAC AGAGGGT GAC 1040 

841 CACCCTAAGGGCATT GAGAT GGATGGGAAAAT GAT GAATTCCCATTTTCT AGAT GGGAAC 900 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II 
1041 CACCCTAAGGGCATT GAGAT GGATGGGAAAAT GAT GAATTCCCATTTTCT AGAT GGGAAC 1100 

901 CTGGTGCCCCT GGAAGGGAAGGAAGTGGAT GAGT C CCGCAGAGAGAT GAT CCGGATT CTC 960 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1101 CTGGTGCCCCTG GAAGGGAAGGAAGT GGAT GAGT C C CGCAGAGAGAT GAT C C G GATT CTC 1160 

961 AAGGAT CT GAAG CAAAAACACCC AGAGAAGGACT T AGAT CAGCT GGT GGAGAT GGC CAAT 1020 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1161 AAGGAT CT GAAG CAAAAACACC CAGAGAAGGACT T AGAT CAG CT GGT GGAGAT GGC CAAT 1220 

1021 TACT AT GCT CT T T C C CAC C AACAGAAGAGC C GCGC CT T CT AC C GT AT C CAAGC C ACT C GT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
1221 TACTATGCTCTTTCCCACCAACAGAAGAGCCGTGCCTTCTACCGTATCCAAGCCACTCGT 1280 

1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAAC AT GCAGCAGAACAAGC CAAGAAGG C C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

1281 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAAC AT GCAGCAGAACAAG C CAAGAAGG C C 1340 

1141 T CCAGCAT GAGC GAG GT GC ACAC C GAT GAGC CT GAGGACT TT ATTT C CAAG GTCTTCTTT 1200 
I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

1341 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1400 

1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1401 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1460 

1261 AAAG GGGGAGAC AT GT CAAAGAC CAT GTAT GT GGACT ACAAAACAGAGGAT GGT T CT GCC 132 0 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1461 AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GT GGACT ACAAAACAGAGGAT GGT T CT GC C 152 0 



Qy 1321 AATGCAG GG GCT GACT AT GAGT T C ACAGAGGG C AC GGT GGT T CT GAAG C CAGGAGAGAC C 1380 

I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1521 AATGCAGGGGCT GAC TAT GAGT T C ACAGAGGG CAC GGT GGT T CT GAAGC CAGGAGAGAC C 1580 

Qy 1381 CAGAAGGAGTT CTC CGTGGGCATAATT GATGACGACATTTTT GAGGAGGAT GAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1581 CAGAAGGAGTT CTC CGT GGGCATAATT GATGACGACATTTTTGAGGAGGAT GAACACTT C 1640 

Qy 1441 TTTGTAAGGTT GAGCAAT GT C CGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1641 T T T GTAAGGT T GAG C AAT GT C CGCATAGAGGAGGAGC AG C CAGAGGAGGGGAT G C CT C CA 1700 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i 

Db 1701 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1760 

Qy 1561 GT T ACC AT CT T GGAT GAT GAC CAT GC AGGC AT CT T CACT T T T GAAT GT GAT ACT AT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1761 GTTACCATCTT GGAT GAT GAC CAT GCAGGCAT CTT CACTTTTGAATGT GAT ACTATTCAT 182 0 

Qy 1621 GT CAGT GAGAGT AT T GGT GT T AT GGAGGT CAAGGT T CT GC GGAC AT CAGGT GCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1821 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1880 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 18 81 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 194 0 

Qy 1741 GAAGACACATAT GGGGAGTT GGAATT CAAGAAT GATGAAACT GT AT GTGACAGACAGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1941 GAAGACACATAT G G GGAGTT G GAATT CAAGAAT GATGAAAC T GT GAAAAC C AT AAG 1996 

Qy 1801 GCT GACT AT G GAAGAAGAGGAGGC CAAGAGGAT AG C AGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 

Db 1997 GGTT AAAAT AGT AGAT GAGGAGGAATAC GAAAGG CAAGAGA 2037 



RESULT 10 
AF510501 

LOCUS AF510501 5250 bp mRNA linear PRI 30-OCT-2002 

DEFINITION Homo sapiens Na+/Ca2+ exchanger isoform 3 splice variant 2 (SLC8A3) 

mRNA, complete cds ; alternatively spliced. 
ACCESSION AF510501 

VERSION AF510501.1 GI: 24421220 

KEYWORDS 

SOURCE Homo sapiens (human) 

ORGANISM Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
REFERENCE 1 (bases 1 to 5250) 

AUTHORS Gabellini, N. , Bortoluzzi, S . , Danieli,G.A. and Carafoli,E. 
TITLE The human SLC8A3 gene and the tissue-specific Na(+)/Ca(2+) 

exchanger 3 isoforms 
JOURNAL Gene 298 (1), 1-7 (2002) 
MEDLINE 22294016 
PUBMED 12406570 



REFERENCE 2 (bases 1 to 5250) 

AUTHORS Gabellini,N. , Bortoluzzi, S . , Danieli,G.A. and Carafoli,E. 
TITLE Direct Submission 

JOURNAL Submitted ( 09-MAY-2002 ) Department of Biology, Unv. of Padova, via 
G. Colombo, Padova, PD 35131, Italy 
FEATURES Location/Qualifiers 
source 1. .5250 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon: 9606" 

/ chromosome="14" 

/map="14q24.2" 
gene 1. .5250 

/gene="SLC8A3" 
5 1 UTR 1. .754 

/gene="SLC8A3" 
CDS 755. .3520 

/gene="SLC8A3 " 

/note-"NCX3 . 2 ; expressed in brain and skeletal muscle; 
alternatively spliced" 
/ codon_start=l 

/product="Na+/Ca2+ exchanger isoform 3 splice variant 2" 
/protein_id="AAN607 90. 1" 
/db_xref="GI : 24421221" 

/translation-"MAWLRLQPLTSAFLHFGLVTFVLFLNGLRAEAGGSGDVPSTGQN 
NESCSGSSDCKEGVILPIWYPENPSLGDKIARVIVYFVALIYMFLGVSIIADRFMASI 
EVITSQEREVTIKKPNGETSTTTIRVWNETVSNLTLMALGSSAPEILLSLIEVCGHGF 
IAGDLGPST I VGSAAFNMFI 1 1 GI C VYVI PDGETRKI KHLRVFFITAAWS I FAYIWLY 
MIIAVFSPGWQWEGLLTLFFFPVCVLLAWVADKRLLFYKYMHKKYRTDKHRGIIIE 
TEGDHPKGIEMDGKMMNSHFLDGNLVPLEGKEVDESRREMIRILKDLKQKHPEKDLDQ 
LVEMAN YYALSHQQKS RAFYRI QATRMMTGAGNI LKKHAAEQAKKAS SMS EVHTDEPE 
DFISKVFFDPCSYQCLENCGAVLLTWRKGGDMSKTMYVDYKTEDGSANAGADYEFTE 
GT WLKPGETQKEFSVGI I DDDI FEEDEHFFVRLSNVRI EEEQPEEGMPPAI FNSLPL 
PRAVLAS P CVAT VT I LDDDHAG I FT FECDT I HVS E S I G VMEVKVLRT S GARGTVI VP F 
RTVEGTAKGGGEDFEDTYGELEFKNDETVKTIRVKIVDEEEYERQENFFITU^GEPKWM 
ERGISDVTDRKLTMEEEEAKRIAEMGKPVLGEHPKLEVIIEESYEFKTTVDKLIKKTN 
LALWGTH SWRDQFMEAI TVSAAGDEDEDE SGEERL P S CFD YVMH FLT VFWKVL FACV 
P PT E YCHGWAC FAVS I L 1 1 GMLT AI I GDLAS H FGCT I GLKD S VTAWFVAFGT S VP DT 
FAS KAAALQ DVYADAS I GNVTGSNAVNVFLGI GLAWS VAAI YWALQGQEFHVSAGTLA 
FS VTL FTI FAFVCI SVLLYRRRPHLGGELGGPRGCKLATTWLFVS LWLLYI LFATLEA 
YCYIKGF" 

3'UTR 3521. .5250 

/gene="SLC8A3 " 

polyA_signal 5221. .5226 

/gene="SLC8A3" 

ORIGIN 



Query Match 95.7%; Score 1783; DB 9; Length 5250; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 1812; Conservative 0; Mismatches 25; Indels 4; Gaps 1; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 755 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 814 



Qy 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 815 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 874 

Qy 121 ACAGGG CAGAACAAT GAGT C CT GT T C AGGGT CAT C GGACT GCAAGGAGG GT GT CAT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 875 ACAGGGCAGAACAAT GAGT CCT GTT C AGGGT CAT C G GACT GCAAGGAGG GT GT CAT C CT G 934 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I II I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 935 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 994 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I Kl I I I I I I I I I I I I I 
Db 995 T T T GT G GC C CT GAT AT ACAT GT T CCT T GGGGT GT C CAT C ATT GCT GACC GCTT CAT GGC A 1054 

Qy 301 T CTAT T GAAGT CAT C AC CT CTCAAGAGAGG GAGGT GACAATT AAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1055 T CT ATT GAAGT CAT CACCT CT CAAGAGAGG GAGGT GACAATT AAGAAAC C CAAT GGAGAA 1114 

Qy 361 AC C AG C AC AAC C ACT AT TCGGGTCTG GAAT GAAACT GT CT C C AAC CT GAC CCT TAT GGC C 420 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1115 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 1174 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1175 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 1234 

Qy 481 AT T GCT GGT GAT CT GGGAC CTT CT AC CAT T GT AGGGAGT GCAGCCT T CAACAT GTT CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1235 AT T GCT GGT GAT CT GG GAC CTT CT AC CAT T GT AGGGAGT GCAGCCT T CAACAT GTT CAT C 1294 

Qy 541 AT CATT GGCAT CT GT GTCTACGTGAT CCCAGACGGAGAGACT CGCAAGAT CAAGCAT CTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1295 AT CATTGGCATCT GT GTCTACGT GAT CCCAGACGGAGAGACTCGCAAGAT CAAGCAT CTA 1354 

Qy 601 C GAGT CTT CTT CAT C AC C G CTGCTT GGAGT AT CTT T GCCTACAT CT G GCT CTAT AT GAT T 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1355 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1414 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1415 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1474 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 7 80 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1475 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1534 

Qy 781 AT G C AC AAAAAGT AC C G C AC AG AC AAAC AC C GAG GAAT TAT C AT AGAG AC AG AG GGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1535 AT G C AC AAAAAGT AC C G C AC AGAC AAAC AC C GAGGAAT TAT CAT AGAG AC AG AG GGT GAC 1594 

Qy 841 CAC C CT AAG GG C AT T GAGAT GGAT G GGAAAAT GAT GAAT T C C CAT T TT CTAGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1595 CAC C CTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAAT T C C CAT T TT C TAGAT GGGAAC 1654 

Qy 901 CT GGT GCC C CT GGAAGGGAAG GAAGT GGAT GAGT C C CGCAGAGAGAT GAT C C GGAT T CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1655 CTGGTGCCCCTG GAAGGGAAG GAAGT G GAT GAGT C C C G C AGAGAGAT GAT C C G GAT T CT C 1714 



Qy 961 AAGGAT CT GAAGCAAAAAC AC C C AGAGAAGGAC T TAGAT CAG CT GGT GGAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1715 AAGGATCTGAAGCAAAAACAC CCAGAGAAGGACTTAGAT CAGCT GGT GGAGAT GGCCAAT 1774 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1775 TACTATGCTCTTTCCCACCAACAGAAGAGCCGTGCCTTCTACCGTATCCAAGCCACTCGT 1834 

Qy 1081 AT GAT GACT GGTGCAGGCAAT AT CCT GAAGAAACATGCAGCAGAACAAGC CAAGAAGGCC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1835 AT GAT GACT GGT GCAGG CAATAT C CT GAAGAAACAT GCAG CAGAACAAGC CAAGAAGGC C 1894 

Qy 1141 TC CAGCATGAGCGAGGT GCACACC GAT GAGCCTGAGGACTTTATTTCCAAGGT CTTCTTT 1200 

I M I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I 

Db 1895 TCCAGCATGAGCGAGGT GCACACC GAT GAGCCTGAGGACTTTATTT CCAAGGT CTTCTTT 1954 

Qy 1201 GACCCATGTT CTT ACCAGTGCCT GGAGAACTGT GGGGCTGTACTCCTGACAGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 1955 GACCCATGTTCTTACCAGTGCCT GGAGAACT GT GGGGCTGTACT CCTGACAGT GGT GAGG 2014 

Qy 1261 AAAGGGGGAGACAT GT CAAAGACCAT GT ATGT GGACTACAAAACAGAGGAT GGTT CT GCC 132 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 2015 AAAGGGGGAGACAT GT CAAAGAC CAT GT AT GT GGACTACAAAACAGAGGAT GGTTCTGCC 2074 

Qy 1321 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2075 AAT GCAGGGGCT GACT AT GAGTT CACAGAG GGC ACGGT GGTT CT GAAGC C AGGAGAGAC C 2134 

Qy 1381 C AG AAG G AGT TCTCCGTGG G CAT AAT T GAT G AC GAC AT T T T T GAG GAG GAT GAAC AC T T C 144 0 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2135 CAGAAGGAGTT CT CCGT GGGCATAATT GAT GACGACATTT TT GAGGAGGAT GAACACTT C 2194 

Qy 1441 TTT GTAAGGTTGAGCAATGT CCGCAT AGAGGAGGAGCAGC CAGAGGAGGGGAT GCCTCCA 150 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2195 TTT GT AAGGT T GAGCAAT GT C C GCAT AGAGGAGGAGCAGC CAGAGGAGGGGAT GCCT CCA 2254 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2255 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 2314 

Qy 1561 GTTACCATCTTGGATGATGACCATGCAGGCATCTTCACTTTTGAATGTGATACTATTCAT 1620 

I I I I I I I I I II I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2315 GT TAC CAT CT T GGAT GAT GAC CAT GCAGG CAT CTT C ACT T T T GAAT GT GAT AC TAT T CAT 237 4 

Qy 1621 GT CAGT GAGAGT ATT G GTGT TAT GGAG GT CAAGGTT CT GC GGACAT C AGGT GC CC G G GGT 168 0 

I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2375 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 2434 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 2435 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 2494 

Qy 1741 GAAGACACAT AT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GTAT GT GACAGACAGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I 

Db 2495 GAAGACACAT AT GGGGAGTTGGAATT CAAGAAT GAT GAAAC T GT GAAAAC CAT AAG 2550 



Qy 1801 GCT GACT AT GGAAGAAGAGGAGG C CAAGAG GAT AGC AGAGA 1841 

I I I I I I I I I I I I I I I I I I Mill 

Db 2551 GGTTAAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGA 2591 
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AF510502 5268 bp mRNA linear PRI 30-OCT-2002 

Homo sapiens Na+/Ca2+ exchanger isoform 3 splice variant 3 (SLC8A3) 
mRNA, complete cds ; alternatively spliced. 
AF510502 

AF510502.1 GI: 24421222 

Homo sapiens (human) 
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1 (bases 1 to 5268) 
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The human SLC8A3 gene and the tissue-specific Na(+)/Ca(2+) 

exchanger 3 isoforms 

Gene 298 (1) , 1-7 (2002) 

22294016 

12406570 

2 (bases 1 to 5268) 

Gabellini, N. , Bortoluzzi, S . , Danieli,G.A. and Carafoli,E. 
Direct Submission 
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G. Colombo, Padova, PD 35131, Italy 

Location/Qualifiers 

1. .5268 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/chromosome="14 " 
/map="14q2 4.2" 
1. .5268 
/gene="SLC8A3" 
1. .754 

/gene="SLC8A3" 
755. .3538 
/gene="SLC8A3" 

/note="NCX3. 3; expressed in skeletal muscle; alternatively 

spliced" 

/codon_start=l 

/product="Na+/Ca2+ exchanger isoform 3 splice variant 3" 
/protein_id="AAN60791 .1" 
/db_xref="GI : 24421223" 

/translatio n= ' ' MAWL RLQ P LT S AFLH FGLVT FVL FLN GL RAEAGG S G D VP S T GQN 
NESCSGSSDCKEGVILPIWYPENPSLGDKIARVIVYFVALIYMFLGVSIIADRFMASI 
EVITSQEREVTIKKPNGETSTTTIRVWNETVSNLTLMALGSSAPEILLSLIEVCGHGF 
I AGDLGPST I VGSAAFNMFI 1 1 GI CVYVI PDGETRKI KHLRVFFITAAWS I FAYIWLY 
MILAVFSPGVVQWEGLLTLFFFPVCVLIAWVADKRLLFYKYMHKKYRTDKHRGIIIE 
TEGDHPKGIEMDGKMMNSHFLDGNLVPLEGKEVDESRREMIRILKDLKQKHPEKDLDQ 
LVEMANYYALSHQQKSRAFYRIQATRMMTGAGNILKKHAAEQAKKASSMSEVHTDEPE 
DFISKVFFDPCSYQCLENCGAVLLTWRKGGDMSKTMYVDYKTEDGSANAGADYEFTE 
GTWLKPGETQKEFSVGI I DDDI FEEDEHFFVRLSNVRI EEEQPEEGMP PAI FNSLPL 



PRAVLAS PCVATVT I LDDDHAGI FT FECDT I HVS E S I GVMEVKVLRTSGARGTVI VP F 
RTVEGTAKGGGEDFEDTYGELEFKNDETVKTIRVKIVDEEEYERQENFFIALGEPKWM 
ERGISALLLSPDVTDRKLTMEEEEAKRIAEMGKPVLGEHPKLEVIIEESYEFKTTVDK 
LIKKTNLALWGTHSWRDQFMEAITVSAAGDEDEDESGEERLPSCFDYVMHFLTVFWK 
VLFACVPPTEYCHGWACFAVS I LI I GMLTAI I GDLASHFGCT I GLKDSVTAWFVAFG 
TSVPDT FAS KAAAL Q D VYADAS I GNVTGSNAVNVFLGI GLAWSVAAI YWALQGQEFHV 
SAGTLAFSVTLFTIFAFVCISVLLYRRRPHLGGELGGPRGCKLATTWLFVSLWLLYIL 
FATLEAYCYIKGF" 

3'UTR 3539. .5268 

/gene="SLC8A3 " 

polyA_signal 5239. .5244 

/gene="SLC8A3" 

ORIGIN 

Query Match 95.7%; Score 1783; DB 9; Length 5268; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 1812; Conservative 0; Mismatches 25; Indels 4; Gaps 1; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 55 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 814 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 815 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 874 

Qy 121 ACAGGGCAGAACAAT GAGT C CT GTT CAGGGT CAT CGGACT GCAAGGAGGGTGT CATCCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 875 ACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTG 934 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 935 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 994 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I 
Db 995 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 1054 

Qy 301 T C TAT T G AAGT CAT C AC C T C T CAAGAG AG G GAG GT G AC AAT T AAG AAAC C C AAT G G AG AA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1055 T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAG GT GACAATTAAGAAACC CAAT GGAGAA 1114 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1115 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 1174 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1175 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 1234 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I 
Db 1235 ATT GCT GGT GAT C T GGGAC CT T CTAC CATT GT AGGGAGT GCAG C CTT CAACAT GT T CAT C 1294 

Qy 541 AT CATT GGC AT CT GT GT CTAC GT GAT C C CAGAC GGAGAGACT CGCAAGAT CAAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1295 AT CATT GGCAT CT GTGT CTAC GT GAT C C CAGAC G GAGAGACT C GCAAGAT CAAGCAT CT A 1354 



Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1355 C GAGT CT T CT T CAT CACC GC T GCT T GGAGTAT CT TT GCCTAC AT CT G GCT CT AT AT GAT T 1414 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1415 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1474 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I II I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | 
Db 1475 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1534 

Qy 781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 84 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | | | | 
Db 1535 AT GCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGT GAC 1594 

Qy 841 CAC CCT AAG GGCAT T GAGAT GGAT GGGAAAAT GAT GAATT C CCATTT T CT AGAT GG GAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1595 CACCCTAAGGGCATTGAGAT GGAT GGGAAAAT GATGAATT CCCATTTTCTAGAT GGGAAC 1654 

Qy 901 CTGGTGCCCCTGGAAGGGAAGGAAGT GGAT GAGT CCCGCAGAGAGAT GAT C CGGATT CTC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 1655 CT GGTGCCCCTGGAAGGGAAGGAAGT GGAT GAGT CCC GCAGAGAGAT GATCCGGATT CTC 1714 

Qy 961 AAG GAT CT GAAGCAAAAACAC CCAGAGAAGGACT TAGATC AGCT GGT GGAGAT G GC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1715 AAGGAT CT GAAGCAAAAACAC CCAGAGAAGGACT TAGAT C AGCT GGT GGAGAT GGC CAAT 1774 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1775 TACT AT GCTCTTTCC CAC CAAC AGAAGAG CCGTGCCTT CT AC C GT AT C C AAGC C ACT C GT 1834 

Qy 1081 AT GATGACT G GT GC AGG CAAT AT C CT GAAGAAACAT GCAGC AGAACAAGC CAAGAAGGC C 114 0 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill 

Db 1835 ATGATGACTGGTGCAGGCAATATCCTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1894 

Qy 1141 T CCAGC AT GAGCGAGGT GCACAC C GAT GAG C CT GAGGACT T TAT T T C CAAGGT CT T CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1895 T C CAGCAT GAGCGAGGT GCACAC C GAT GAGC CT GAGGACT TT AT T T C CAAG GTCTTCTTT 1954 

Qy 1201 GAC CCAT GTTCTTACCAGT GCCT GGAGAACT GTGGGGCT GTACT C CT GACAGT GGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1955 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 2014 

Qy 1261 AAAG GGGGAGACAT GT CAAAGAC CAT GTAT GTG GACT ACAAAACAGAGGAT GGTT CT GC C 1320 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2015 AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GT GGACT ACAAAACAGAGGAT GGT T CT GC C 2074 

Qy 1321 AAT GCAG GGG CT GACT AT GAGT T CACAGAGGGCAC GGT GGTT CT GAAG CCAGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2075 AAT GCAG GGGCT GACT AT GAGTT CACAGAGG G CAC GGT GGT T CT GAAGC CAGGAGAGAC C 2134 

Qy 1381 CAGAAGGAGTT CTCCGT GGGCATAATTGAT GACGACATTTTTGAGGAGGAT GAACACTT C 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2135 CAGAAGGAGTT CTCCGT GGGCATAATT GATGACGACATTTTT GAGGAGGAT GAACACTT C 2194 



Qy 1441 TTT GTAAGGTTGAGCAATGT CC GCATAGAGGAGGAGCAGC CAGAGGAGGGGAT GCCT CCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 2195 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 2254 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I II I I I 

Db 2255 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 2314 

Qy 1561 G T T AC CAT C T T G GAT GAT G AC CAT G C AG G CAT C T T C AC T T T T G AAT G T GAT AC TAT T CAT 162 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2315 GT T AC CATCTT GGAT GAT GACC AT G C AG GCAT CT T C ACTT T T GAAT GT GAT ACT AT T CAT 2374 

Qy 1621 GT CAGT GAGAGTATTGGT GT TAT GGAG GT CAAGGTT CT GC GGACAT CAGGT GC C C GG GGT 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 2375 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 2434 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2435 AC AGTC AT C GT C C C CT T T AGGACAGT AGAAGGGACAG CCAAGG GT GGC GGT GAGGACT TT 24 94 

Qy 1741 GAAGACACAT ATGGGGAGTT GGAATT CAAGAATGAT GAAACT GTAT GT GACAGACAGGAA 1800 

I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I 

Db 2495 GAAGACACAT AT GG G GAGT T G GAAT T C AAGAAT GAT GAAAC T GT GAAAAC CAT AAG 2550 

Qy 1801 GCT GACTAT GGAAGAAGAGGAGGCCAAGAGGATAGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 

Db 2551 GGTTAAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGA 2591 
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ORIGIN 



AX476820 
Sequence 3 
AX476820 
AX476820.1 



126512 bp 
from Patent WO0233086. 

GI:22216099 



DNA 



linear PAT 12-AUG-2002 



Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Merkulov, G.V. , Ketchum, K. A. , Shao,W w Yan,C, di Francesco, V. and 
Beasley, E.M. 

Isolated human transporter proteins, nucleic acid molecules 
encoding human transporter proteins, and uses thereof 
Patent: WO 0233086-A 3 25-APR-2002; 
PE Corporation (NY) (US) 

Location/Qualif iers 

1. .126512 

/organism="Homo sapiens" 
/mol_type="unas signed DNA" 
/db xref="taxon:9606" 



Query Match 95.7%; Score 1782.8; 

Best Local Similarity 99.9%; Pred. No. 0; 
Matches 1784; Conservative 0; Mismatches 



DB 6; Length 126512; 
2; Indels 0; Gaps 



0; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2010 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 2069 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2070 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 2129 

Qy 121 ACAGGGCAGAACAATGAGT CCT GTT CAGGGT CAT CGGACT GCAAGGAGGGT GT CAT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2130 ACAG G GC AGAACAAT GAGT CCT GT T CAGGGT CAT C GGACT G CAAGGAG GGT GT CAT CCT G 2189 

Qy 181 CCAATCTGGTACCCGGAGJ^ACCCTTCCCTTGGGGAC^GATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 2190 C CAAT CT GGT AC C C GGAGAAC CCTTCCCTT G GGGACAAGAT T GC CAGGGT CAT T GT CT AT 2249 

Qy 241 T TT GT GGC CCT GATAT AC AT GT T CCTT GGGGT GT C CAT CAT T GCT GAC C GCT T CAT GGC A 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2250 T TT GT GG C CCT GAT AT AC AT GTTCCTTGGGGTGTC CAT CAT T GCT GAC C GCT T CAT GGC A 2309 

Qy 301 T CTATTGAAGT CAT CACCTCTCAAGAGAGGGAGGT GACAATTAAGAAACCCAATGGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2310 T CTAT T GAAGT CAT C AC CT CT CAAGAGAGGGAGGT GACAATTAAGAAAC CCAATGGAGAA 2369 

Qy 361 AC C AG C AC AAC C AC TAT TCGGGTCTG GAAT GAAAC T GT C T C C AAC C T GAC CCT TAT G G C C 420 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2370 ACCAGCACAACAACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 2429 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2430 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 24 89 

Qy 481 ATT GCT GGT GAT CTGGGACCTT CTACCATT GTAGGGAGT GCAGCCTT CAACATGTT CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 24 90 ATT GC TGGT GAT CT G GGAC CT T CTACCAT T GTAGGGAGT GC AGC CT T CAACAT GT T CAT C 2549 

Qy 541 ATCATTGGCAT CT GT GT CT ACGT GATCCCAGACGGAGAGACTCGCAAGATCAAGCAT CTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2550 ATCATTGGCATCTGTGTCTACGTGATCCCAGACGGAGAGACTCGCAAGATCAAGCATCTA 2 609 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2610 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 2 669 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 72 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2670 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 2729 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I 
Db 2730 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 2789 

Qy 781 AT G C AC AAAAAGT AC C G C AC AG AC AAAC AC C GAG GAAT TAT C AT AG AG AC AGAG GGT GAC 840 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I 

Db 27 90 AT GC ACAAAAAGTAC CGC ACAGACAAACAC C GAG GAAT TAT CAT AGAGACAGAGG GT GAC 284 9 



Qy 841 CAC CCTAAGGGC AT T GAGAT GGAT GGGAAAAT GAT GAAT T C C CAT T T T CT AGAT GG GAAC 900 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I 
Db 2 850 CACCCTAAGGGCATTGAGATGGATGGGAAAATGATGAATTCCCATTTTCTAGATGGGAAC 2 909 

Qy 901 CT GGT GCC CCT GGAAGGGAAGGAAGT GGAT GAGTCCCGCAGAGAGAT GAT CCGGATT CT C 960 

I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I | M I I 

Db 2910 CT G GT G C C C CT GGAAG GGAAG GAAGT GGAT GAGT C C C GC AGAGAGAT GAT C C GGATT CT C 2969 

Qy 961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCT GGT GGAGATGGCCAAT 1020 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I 

Db 2970 AAGGAT CT GAAG CAAAAAC AC C CAGAGAAGGAC T T AGAT CAGCT GGT GGAGAT GGCCAAT 302 9 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3030 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 308 9 

Qy 1081 AT GAT GACT G GT GCAGGCAAT AT C CTGAAGAAAC AT G CAGCAGAACAAGC CAAGAAGG CC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 3090 ATGATGACTGGTGCAGGCAATATCCTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 3149 

Qy 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3150 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 3209 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3210 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 3269 

Qy 1261 AAAGGGGGAGACAT GT CAAAGACCAT GTAT GT GGACT ACAAAACAGAGGAT GGTT CT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3270 AAAGGGG GAGACAT GT CAAAGACCAT GTAT GT GGACT ACAAAACAGAGGAT GGTT CT GCC 3329 

Qy 1321 AAT GCAGGGGCTGACTAT GAGTTCACAGAGGGCACGGT GGTTCT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3330 AAT GCAGGGGCT GACT AT GAGT T CAC AGAGG GCAC GGT GGT T CT GAAGCCAG GAGAGAC C 3389 

Qy 1381 CAGAAGGAGT T CT C CGT GGGCATAATT GAT GACGACATTTT T GAGGAGGAT GAAC ACT T C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3390 CAGAAGGAGTTCTCCGTGGGCATAATT GAT GACGACATTTTTGAGGAGGAT GAACACTT C 3449 

Qy 1441 T TT GTAAGGT T GAGCAAT GT C C GCAT AGAGGAGGAGCAGCC AGAGGAGGGGAT GC CT C CA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3450 TTT GTAAG GT T GAGCAAT GTC C GCAT AGAG GAGGAGCAGC CAGAGGAG GGGAT GC CT C CA 3509 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3510 GCAATATTC7UVCAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 3569 

Qy 1561 GTT AC CAT CT T GGAT GAT GAC CAT GC AGGCAT C T T CAC T TT T GAAT GT GAT ACT AT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 3570 GTTACCAT CTT GGAT GAT GAC CAT GCAGGCAT CTT CACTTTT GAATGT GATACTATTCAT 3629 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I II I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3630 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 3689 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 3690 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 3749 

Qy 1741 GAAGACAC ATAT G GGGAGT T GGAAT T CAAGAAT GAT GAAACT GT AT 1786 

I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 3750 GAAGACACAT AT G GG GAGT T GGAAT T CAAGAAT GAT GAAACT GT GT 3795 
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AF508982 145118 bp DNA linear PRI 24-OCT-2002 

Homo sapiens Na+/Ca2-f exchanger isoform 3 (SLC8A3) gene, promoter 
region and complete cds . 
AF508982 
AF508982. 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



gene 

promoter 
TATA_signal 



rnRNA 
,133539, 



5 1 UTR 



CDS 



1 GI:22087482 



Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 

1 (bases 1 to 145118) 

Gabellini,N. , Bortoluzzi, S . , Danieli,G.A. and Carafoli,E. 

The human SLC8A3 gene and the tissue-specific Na+/Ca2+ exchanger 3 

isof orms 

Gene 298 (1), 1-7 (2002) 

2 (bases 1 to 145118) 

Gabellini,N. , Bortoluzzi , S . , Danieli,G.A. and Carafoli / E. 
Control of the Na+/Ca2+ exchanger 3 promoter by cAMP and Ca2+ in 
differentiating neurons 
Unpublished 

3 (bases 1 to 145118) 

Gabellini,N. , Bortoluzzi, S . , Danieli,G.A. and Carafoli,E. 
Direct Submission 

Submitted ( 02-MAY-2002 ) Department of Biology, University of 
Padova, via G. Colombo 3, Padova, PD 35131, Italy 

Location/Qualifiers 

1. .145118 

/organism="Homo sapiens" 
/mol__type=" genomic DNA" 
/db_xref="taxon: 9606" 
/ chromosome^ "14" 
/map="14q24.2" 
1. .145118 
/gene-"SLC8A3" 
1. .263 

/gene-"SLC8A3" 
236. .241 
/gene="SLC8A3" 

join (264. .955,20853. . 22698 , 128396 . .128499, 133522. 

137221. .137345,138228. .138327,140293. .140568, 
143012. .145118) 
/gene-"SLC8A3 " 

/product="Na+/Ca2+ exchanger isoform 3" 
join(264. .955,20853. .20914) 
/gene="SLC8A3" 

join (20915. .22698, 128396. . 128499, 133522. . 133539, 



137221. .137345,138228. .138327,140293. .140568, 

143012. .143388) 

/gene="SLC8A3 n 

/note="NCX3; expressed in excitable cells of brain, 

retina, and skeletal muscle" 

/codon_start=l 

/product="Na+/Ca2+ exchanger isoform 3" 
/protein_id="AAM90955 . 1" 
/db_xref="GI : 22087483" 

/ translation="MAWLRLQPLTSAFLHFGLVTFVLFLNGLRAEAGGSGDVPSTGQN 
NESCSGSSDCKEGVILPIWYPENPSLGDKIARVIVYFVALIYMFLGVSIIADRFMASI 
EVITSQEREVTIKKPNGETSTTTIRVWNETVSNLTLIVIALGSSAPEILLSLIEVCGHGF 
I AGDLGP S TI VGSAAFNMFI 1 1 GI CVYVI PDGETRKI KHLRVFFI TAAWS I FAYI WLY 
MILAVFSPGWQVWEGLLTLFFFPVCVLLAWVADKRLLFYKYMHKKYRTDKHRGIIIE 
TEGDHPKGIEMDGKMMNSHFLDGNLVPLEGKEVDESRREMIRILKDLKQKHPEKDLDQ 
LVEMANYYALSHQQKSRAFYRIQATRMMTGAGNILKKHAAEQAKKASSMSEVHTDEPE 
DFISKVFFDPCSYQCLENCGAVLLTWRKGGDMSKTMYVDYKTEDGSANAGADYEFTE 
GTWLKPGETQKEFSVGIIDDDIFEEDEHFFVRLSNVRIEEEQPEEGMPPAI FNSLPL 
P RAVLAS P C VAT VT I L D DDHAG IFTFECDTI H VS ESI GVME VKVL RT S GARGT VI VP F 
RTVEGTAKGGGEDFEDTYGELEFKNDETVKTIRVKIVDEEEYERQENFFIALGEPKWM 
ERGISALLLSPDVTDRKLTMEEEEAKRIAEMGKPVLGEHPKLEVIIEESYEFKTTVDK 
LIKKTNLALWGTHSWRDQFMEAITVSAAGDEDEDESGEERLPSCFDYVMHFLTVFWK 
VLFACVP PTEYCHGWAC FAVS I LI I GMLTAI I GDLAS H FGCT I GL KDS VTAWFVAFG 
TSVPDTFASKAAALQDWADASIGNWGSNAWVFLGIGLAWSVAAIYWALQGQEFHV 
SAGTLAFSVTLFTIFAFVCISVLLYRRRPHLGGELGGPRGCKLATTWLFVSLWLLYIL 
FATLEAYCYIKGF" 

3 1 UTR 143389. .145118 

/gene="SLC8A3 " 

polyA_signal 145089. .145094 
/gene-"SLC8A3" 

ORIGIN 

Query Match 95.7%; Score 1782.8; DB 9; Length 145118; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1784; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 20915 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 20974 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 20975 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 21034 

Qy 121 ACAGGGCAGAACAAT GAGT CCT GTTCAGGGTCAT C GGACT GCAAGGAGGGTGTCAT CCT G 18 0 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 21035 ACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTG 21094 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

1 1 1 i 1 1 I I I 1 1 1 1 1 I 1 1 1 1 1 I I I 1 1 1 I I I 1 1 1 1 1 I 1 1 I I I I I I I 1 1 1 I I 1 1 1 I I I 1 1 1 1 1 

Db 21095 C CAAT CT GGT AC CC G GAGAAC C CT T CC CT TGGGGACAAGAT T GC C AGG GT CAT T GT CT AT 21154 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 21155 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 21214 



Qy 



301 



T CT AT T GAAGT CAT C AC CT CT C AAG AGAG GGAG GT GAC AAT T AAGAAAC C C AAT GGAGAA 360 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 21215 TCTATT GAAGT CAT CAC CT CT CAAGAGAGGGAG GT GACAAT T AAGAAAC C CAAT GGAGAA 21274 

Qy 361 AC CAGCACAACCACT ATT CGGGT CTGGAAT GAAACT GT CT CCAACCT GACC CTT AT GGCC 420 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 21275 AC CAGC ACAAC CAC TAT TCGGGTCTG GAAT GAAAC T GT CT C CAACCT GAC C CT TAT GGCC 21334 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I 

Db 21335 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 21394 

Qy 481 ATT GCT G GT GAT CT GG GAC CT TCT AC C ATT GT AG GGAGT GC AGCCTT CAACAT GT T CAT C 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 21395 ATT GCT G GT GAT CT GG GAC CTTCT AC C ATT GT AG GGAGT GC AGCCTT CAACAT GT T CAT C 21454 

Qy 541 ATCATT G GCAT CT GT GT CTAC GT GAT C C C AGAC G GAGAGAC T C GCAAGAT CAAGCAT CTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 21455 AT C ATT G GC AT CT GT GT CTAC GT GAT C C C AGAC G GAGAGACT C GCAAGAT CAAGCAT CTA 21514 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 21515 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 21574 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 21575 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 21634 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 21635 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 21694 

Qy 781 AT GCACAAAAAGT ACC GCACAGACAAAC AC C GAG GAAT TAT C AT AGAGAC AGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 21695 AT G CACAAAAAGT ACC GCACAGACAAACAC C GAG GAAT TAT CATAGAGACAGAGGGT GAC 21754 

Qy 841 CACCCTAAGGGCATTGAGATGGATGGGAAAATGATGAATTCCCATTTTCTAGATGGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 21755 CACCCTAAGGGCATTGAGATGGATGGGAAAATGATGAATTCCCATTTTCTAGATGGGAAC 21814 

Qy 901 CT GGTGCCCCTGGAAGGGAAGGAAGT GGAT GAGT CCCGCAGAGAGAT GATCCGGATTCTC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 21815 CT GGTGC CCCTGGAAGGGAAGGAAGTGGAT GAGT CCCGCAGAGAGAT GATCCGGATTCTC 218 74 

Qy 961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGATGGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 21875 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGATGGCCAAT 21934 

Qy 1021 TACT AT GCTCTTTCC CAC CAAC AGAAGAG CCGCGCCT T CT AC C GT AT C CAAGC C ACT C GT 1080 

II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 21935 TACT AT GCT CTT T CCC ACCAACAGAAGAGC C GT GC CT T CT ACC GT AT C CAAGC CACT C GT 21994 

Qy 1081 AT GAT GACT GGT GCAG GCAATAT C CT GAAGAAACAT GCAGCAGAACAAGC CAAGAAG G CC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 21995 AT GAT GACT G GT GCAGGCAAT AT C CT GAAGAAACAT G CAGCAGAACAAG C C AAGAAGGC C 22054 

Qy 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



22055 T CC AGC AT GAG C GAGGT GC ACAC C GAT GAGC CT GAGGACT T TAT T T C CAAGGT CT T CT TT 22114 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



12 01 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
22115 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 2217 4 

12 61 AAAGGGGGAGACAT GTCAAAGACCATGTAT GT GGACTACAAAACAGAGGAT GGTTCTGCC 1320 
I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
22175 AAAGGGGGAGACAT GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAG GAT GGT T CT GC C 22234 

1321 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 
I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
22235 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 22294 

1381 CAGAAGGAGT T CT C CGT GG GCAT AATT GAT GACGACAT TT T T GAGGAGGAT GAACACT T C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

222 95 CAGAAGGAGT T CT C CGT GGGCAT AATT GAT GAC GACAT TT T T GAGGAGGAT GAACACT T C 22354 

1441 TTT GT AAG GT T GAGCAAT GT C CGCAT AGAGGAGGAGCAGC C AGAGGAG GGGAT GC CT C CA 1500 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
22355 TTT GTAAGGTT GAGCAAT GT C CGCAT AGAGGAGGAGCAGCCAGAGGAGGGGATGCCT CCA 22414 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I II I I I I I 

22415 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 22474 

1561 GT T AC CAT CT T GGAT GAT GAC CAT GC AG GCAT CT T C ACT T T T GAAT GT GAT ACT AT T CAT 1620 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
22475 GTTACCAT CTTGGATGAT GAC CAT GCAG GCAT CTT CACTTTT GAATGT GATACTATTCAT 22534 

1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 168 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

22535 GT CAGT GAGAGT AT T GGT GT TAT G GAGGT CAAGGT T CT GC G GACAT C AG GTGCCCGGGGT 22594 

1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

22595 ACAGT CAT CGT CC C CTTTAGGACAGT AGAAG G GAC AGC CAAGGGT GG C GGT GAGGACT T T 22654 

17 41 GAAGACACAT AT GGGGAGTT G GAAT T CAAGAAT GAT GAAACT GT AT 1786 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
22655 GAAGACACAT AT GGGGAGT T GGAAT T CAAGAAT GAT GAAACT GT GT 22700 
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TITLE Homo sapiens, clone RP11-1I11 

JOURNAL Unpublished 
REFERENCE 2 (bases 1 to 146055) 

AUTHORS Birren,B., Linton, L., Nusbaum, C . , Lander, E., Allen, N., Anderson, M. 

Baker, J., Baldwin, J., Barna,N., Beckerly,R., Benn,J., Brown, A., 
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TITLE Direct Submission 

JOURNAL Submitted (28-AUG-1999 ) Whitehead Institute/MIT Center for Genome 
Research, 320 Charles Street, Cambridge, MA 02141, USA 
COMMENT On May 25, 2000 this sequence version replaced gi: 7321520. 

All repeats were identified using RepeatMasker : 
Smit, A.F.A. & Green, P. (1996-1997) 

http : //ftp . genome . Washington . edu/RM/ RepeatMasker . html 
Genome Center 

Center: Whitehead Institute/ MIT Center for Genome Research 

Center code: WIBR 

Web site: http://www-seq.wi.mit.edu 

Contact : sequence_submissions@genome . wi .mit . edu 

Project Information 

Center project name: L1464 
Center clone name: 1_I_11 

Summary Statistics 

Sequencing vector: M13; M77815; 99% of reads 

Sequencing vector: Plasmid; n/a; %-0.f%% of reads 

0 . 776287932251235Chemistry : Dye-primer-amersham; 6% of reads 

Chemistry: Dye-terminator Big Dye; 94% of reads 

Assembly program: Phrap; version 0.960731 

Consensus quality: 126247 bases at least Q40 

Consensus quality: 134710 bases at least Q30 

Consensus quality: 138332 bases at least Q20 

Insert size: 160000; agarose-fp 

Insert size: 143055; sum-of -contigs 

Quality coverag. 

* NOTE: This is a 'working draft' sequence. It currently 

* consists of 31 contigs. The true order of the pieces 

* is not known and their order in this sequence record is 

* arbitrary. Gaps between the contigs are represented as 

* runs of N, but the exact sizes of the gaps are unknown. 

* This record will be updated with the finished sequence 

* as soon as it is available and the accession number will 

* be preserved. 

* 1 1166: contig of 1166 bp in length 

* 1167 1266: gap of 100 bp 

* 1267 2417: contig of 1151 bp in length 

* 2418 2517: gap of 100 bp 
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Location/Qualifiers 
1. .146055 

/organism- "Homo sapiens" 
/mo l_type=" genomic DNA" 
/db_xref="taxon:9606" 
/clone="RPll-lIll" 

/clone_lib="RPCI-ll Human Male BAC" 
1. .1166 



/ r-i -|- o — 

/ 11U U C- — 


cloo fc:llLLJJ_y 


1_ J_ dy lilt: 11 L. 


1267 . 


. 2417 




/ no t s~ 


do o ciiuj -L _y 


"F T" ^ rrm pnt - 
j_ j. dy nicu l. 


2518 . 


.3635 




/ note— 


,f a c c; pmK 1 \7 
do J ClLLU _L y 


■p V-a rTTTl f^TI "f - 
1_ J_ d y ILLvzTll L» 


3736 . 
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ass emu x y 


r y ^ rrTTi cin +" 

J.J. dyiiiciiu 


4952 . 


.6701 




/ note— 


* a C! C dTYlV\ T T 7 
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60969. 

/ note- 

65281. 

/note= 

72596. 

/ note= 

79637 

/ note= 

86114. 

/ note- 

98568. 

/ note= 

112413 

/note= 

128834 

/note= 



65180 
"assembly 
.72495 
assembly^ 
.79536 
"assembly_ 

86013 
"assembly^ 
.98467 
assembly_ 
.112312 
"assembly_ 
.128733 
assembly^ 
.146055 
"assembly_ 



fragment " 
fragment" 
fragment" 
fragment" 
fragment" 
fragment" 
fragment" 
fragment" 



Query Match 95.7%; 
Best Local Similarity 99.9%; 
Matches 1784; Conservative 



Score 1782.8; DB 2; 
Pred. No. 0; 
0; Mismatches 2; 



Length 146055; 
Indels 0; Gaps 



0; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 138575 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 

138634 



Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 138 635 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 

138694 

Qy 121 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGT CAT CGGACT GCAAGGAGGGT GTCAT CCTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 138 695 ACAGGG CAGAACAAT GAGT C CT GTT CAGGGT CAT CGGACT G CAAG GAGGGT GT CAT C CTG 

138754 



Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I 
Db 138755 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 

138814 



Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 138 815 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 

138874 



Qy 301 T CT ATT GAAGT CAT CAC CT CT C AAGAGAG GGAGGT GACAAT T AAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 138 875 T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT TAAGAAACC CAAT GGAGAA 

138934 



Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 138 935 AC C AG C AC AAC CAC TAT TCGGGTCTG G AAT G AAAC T GT C T C C AAC C T G AC CCT TAT G G C C 

138994 



Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 138995 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 

139054 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 139055 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTC7UVCATGTTCATC 

139114 

Qy 541 AT CAT T GGCAT CT GT GT CT AC GT GAT C C CAGAC GGAGAGACT C G CAAGAT CAAGCATCT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 139115 AT CAT T GGCAT CT GT GT CT AC GT GAT C C CAGAC G GAGAGACT C GCAAGAT CAAGC AT CT A 

139174 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 139175 C GAGT CT T CT T CAT CAC C GCT G CTT GGAGT AT CTTT G C CT AC AT CT GG CT CTAT AT GAT T 

139234 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 139235 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 

139294 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 139295 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 

139354 

Qy 781 ATGCACAA7WVGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 139355 AT GCACAAAAAGT AC C GCACAGACAAAC ACCGAGGAAT T ATC AT AGAGACAGAGG GT GAC 

139414 

Qy 841 CACC CT AAGGGCATT GAGAT GGAT GG GAAAAT GAT GAAT T CC C AT TTT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 139415 CACCCTAAGGGCATT GAGATGGATGGGAAAAT GATGAATTCC CATTTT CTAGAT GGGAAC 

139474 

Qy 901 CT GGT GCCCCT GGAAGGGAAGGAAGT GGAT GAGT CCCGCAGAGAGAT GAT CCGGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 139475 CTGGT GCCCCT GGAAGGGAAGGAAGT GGATGAGT CCCGCAGAGAGATGAT CCGGATTCTC 

139534 

Qy 961 AAGGAT CT GAAG CAAAAAC AC CCAGAGAAGGACT T AGAT C AG CT GGTGGAGAT G GC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 139535 AAGGAT CT GAAG CAAAAACAC CCAGAGAAGGACT T AGAT CAGC T G GTGGAGAT G GC CAAT 

139594 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 139595 TACT AT GCT CTT T CC CAC CAAC AGAAGAGC C GT GCCT T CTAC C GT AT C CAAGC CACT CGT 

139654 



Qy 



1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAAC AT GCAGCAGAACAAGC C AAGAAGGC C 114 0 
I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 



Db 139655 AT GAT GACT GGT GCAGGCAATATCCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGC C 

139714 

Qy 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 139715 T C CAGCAT GAG C GAG GT GCACACC GAT GAGC CT GAG GAC T TT ATT T C CAAG GTCTTCTTT 

139774 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 139775 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 

139834 

Qy 1261 AAAGGGGGAGACAT GT CAAAGAC CAT GTATGT GGACT ACAAAACAGAGGAT GGT T CT GC C 132 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 139835 AAAGGG GGAGAC AT GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGAT GGTTCTGCC 

139894 

Qy 1321 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 138 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 139895 AATGCAGG GGCT GAC TAT GAGT T CAC AGAGGGCAC GGT GGTT CT GAAGC CAGGAGAGAC C 

139954 

Qy 1381 CAGAAGGAGTTCT CCGTGGGCATAAT T GAT GACGACATTT TT GAGGAGGAT GAACACTT C 144 0 

I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 139955 CAGAAGGAGTTCT CCGTGGGCATAATT GAT GACGACATTTTT GAGGAGGATGAACACTT C 

140014 

Qy 1441 TT T GT AAGGTT GAGCAAT GT C C GCAT AGAGGAGGAGCAGC CAGAG GAGGGGAT GC CT CC A 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 14 0015 T T TGT AAGGTT GAGCAAT GT C C GCAT AGAGGAGGAGCAGC CAGAGGAGGGGAT GC CT CC A 

140074 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 140075 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 

140134 

Qy 1561 GTTACCATCTTGGATGATGACCATGCAGGCATCTTCACTTTTGAATGTGATACTATTCAT 162 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 0135 GTTACCAT CTTGGAT GAT GACCATGCAGGCAT CTTCACTTTT GAATGTGATACTATT CAT 

140194 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 140195 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 

140254 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 0255 ACAGT CAT C GT C C CCT TT AG GACAGT AGAAGG GACAGCCAAGGGT GGC GGT GAGGACTTT 

140314 

Qy 1741 GAAGAC ACAT AT G GG GAGT T GGAAT T C AAGAAT GAT GAAACT GT AT 1786 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 140315 GAAGACAC ATAT G GG GAGT T GGAATT CAAGAAT GAT GAAACT GT GT 140360 
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1. .206256 

/organism= ,, Homo sapiens" 
/mol_t yp e= " genomi c DNA" 
/db_xref="taxon: 9606" 
/ chromosome="14" 
/clone="R~486013" 
/clone_lib="RPCI-ll" 
16782. .16970 

/note="matching EMBL : AF029900 

RHdb:RH103433 

dbSTS:STS70962 

Identified using the e-PCR software (G. Schuler) " 
72147. .72239 

/note="matching EMBL:G37613 
RHdb:RH101557 
RHdb:RH82090 
dbSTS:STS58442 

Identified using the e-PCR software (G. Schuler) " 

116803. .116967 

/note="matching EMBL:Z44310 

RHdb:RH2 6997 

dbSTS:STS15075 

Identified using the e-PCR software (G. Schuler) " 

118337. .118551 

/note="matching EMBL:Z38712 

RHdb:RH10057 

dbSTS:STS12967 

Identified using the e-PCR software (G. Schuler) " 

144730. .144853 

/note="matching EMBL:F13424 

RHdb:RH44806 

dbSTS:STS37874 

Identified using the e-PCR software (G. Schuler)" 

145994. .146150 

/note="matching EMBL:T17195 

RHdb:RH78238 

dbSTS:STS54980 

Identified using the e-PCR software (G. Schuler) " 

146051. .146200 

/note="matching EMBL:H15034 

RHdb:RH53547 

dbSTS:STS14940 

Identified using the e-PCR software (G. Schuler) " 

147348. .147523 

/note="matching EMBL:Z23692 

RHdb : RH9565 

dbSTS:STS25409 

Identified using the e-PCR software (G. Schuler) " 

147371. .147522 

/note="matching EMBL:Z23692 

RHdb:RH73223 

RHdb :RH4 9065 

RHdb:RH13015 

RHdb : RH37 6 

dbSTS:STS30523 
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ORIGIN 



Query Match 95.7%; Score 1782.8; DB 9; Length 206256; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1784; Conservative 0; Mismatches 2; Indels 0; Gaps 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 95395 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 95454 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 95455 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 95514 

Qy 121 AC AG GG C AGAACAAT GAGT C CT GT T C AGGGT CAT C G GAC T G CAAG GAG GGT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 95515 ACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTG 95574 

Qy 181 CCAAT CT GGT AC C C GGAGAACC CT T CC CTT GGGGACAAGAT T GC CAGGGT CAT T GT CTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 95575 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 95634 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 95635 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 95694 

Qy 301 TCTATT GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAATTAAGAAACCCAATGGAGAA 360 

I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 95695 T CT ATT GAAGTC ATCAC CT CT CAAGAGAGG GAGGT GACAAT TAAGAAAC C CAAT GGAGAA 95754 

Qy 361 AC C AGC ACAAC C ACT ATT C GGGT CT GGAAT GAAACT GT CT C CAAC CT GAC C CT TAT G GC C 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 95755 AC C AG C ACAAC C ACT ATT C GGGT CT GGAAT GAAACT GTCT C CAAC CT GAC C CT TAT G GC C 95814 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 95815 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 95874 

Qy 481 ATT GCT GGT GATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACAT GTT CATC 540 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 95875 AT T GCT GGT GAT CT GGGAC CTTCT AC CATT GT AGGGAGT G CAGC CT T CAAC AT GTT CAT C 95934 

Qy 541 AT CATT GGCATCT GTGT CTACGT GATCCCAGACGGAGAGACTCGCAAGAT CAAGCATCTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 95935 AT CAT T GGCAT CT GT GT CTACGT GAT C CC AGAC GGAGAGACT C G CAAGAT CAAGCAT CT A 95994 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 95995 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 96054 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 96055 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 96114 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 96115 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 96174 



Qy 781 ATGCACAAAAAGT AC C GCAC AGACAAACAC C GAGGAAT TAT CAT AGAGAC AGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 96175 ATG CACAAAAAGT AC C GCAC AGACAAACAC C GAG GAAT TAT CAT AGAGAC AGAGGGT GAC 96234 

Qy 841 CACC CTAAGGGCATT GAGAT GGAT GGGAAAATGAT GAATT CCCATTT T CT AGAT GGGAAC 900 

I 1 1 I 1 1 I I I 1 1 I I I I I I 1 1 1 I I I 1 1 1 1 I I 1 1 1 1 I I I I I I 1 1 I 1 1 I I i 1 1 I I I I 1 1 1 1 I I I 

Db 96235 CACCCTAAGGGCAT TGAGAT GGAT GGGAAAAT GAT GAATT CCCATTTTCT AGAT GGGAAC 96294 

Qy 901 CT GGT GC CC CT GGAAGG GAAGGAAGT GGAT GAGT C C C G CAGAGAGAT GAT C CGGATT CT C 960- 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 96295 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTCTC 96354 

Qy 961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGATGGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 96355 AAGGAT CT GAAGCAAAAACAC C C AGAGAAGGACT T AGAT C AGCT G GT GGAGAT GG CCAAT 96414 

Qy 1021 TACT AT GCTCTTTCC C AC C AAC AGAAGAGC C GC GC C T T C T AC C GT AT C CAAG C C ACT C GT 1080 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 96415 TACTATGCTCTTTCCCACCAACAGAAGAGCCGTGCCTTCTACCGTATCCAAGCCACTCGT 96474 

Qy 1081 AT GAT GACT GGT GC AGGCAAT AT CCT GAAGAAACAT GC AGC AGAACAAGC CAAGAAGGCC 1140 

II I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ' 

Db 96475 AT GAT GACT GGT GC AGGCAAT AT C CT GAAGAAACAT GCAG CAGAACAAGCCAAGAAGGC C 96534 

Qy 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 96535 T CCAGCAT GAGC GAGGT GCAC AC C GAT GAG C CT GAGGACTT TAT TTC CAAG GT CTT CT T T 96594 

Qy 1201 GAC C CAT GT T CTT ACCAGT G C CT G GAGAACT GTGGGGCT GT ACT C CT GACAGT G GT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 96595 GAC C CAT GT T CT T AC CAGT G C CT GGAGAACT GTGG GGCT GT ACT C CT GACAGTGGT GAGG 96654 

Qy 1261 AAAGGGGGAGACAT GT CAAAGACC AT GT AT GT GGACT ACAAAACAGAGGAT GGTTCTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 96655 AAAGGGGGAGACAT GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGAT G GTT CT GC C 96714 

Qy 1321 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCAC GGT GGTT CT GAAGCCAGGAGAGACC 1380 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 96715 AAT GCAGGGG CT GACT AT GAGT T C ACAGAGGGCAC GGT G GT T CT GAAGC CAGGAGAGAC C 96774 

Qy 1381 CAGAAGGAGTT CTC CGT GGGCATAATTGATGACGACATTTTTGAGGAGGAT GAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 96775 CAGAAGGAGTT CT C C GT GGGC ATAATT GAT GAC GAC ATTTT T GAGGAGGAT GAACACTT C 96834 

Qy 1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I II I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 96835 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 96894 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 96895 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 96954 

Qy 1561 GTTACCAT CTTGGAT GAT GAC CAT GCAGGCAT CTT CACTTTT GAAT GT GATACTATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 96955 GT T AC CAT CT T GGAT GAT GAC CAT GCAGG CAT CTT C ACT TT T GAAT GT GAT ACT AT T CAT 97014 



Qy 1621 GTCAGT GAGAGT AT T GGT GT T AT GGAGGT CAAGGT T CT GC G GAC AT C AG GTGCCCGGGGT 1680 







1 I 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I | 




Db 


97015 


GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 


97074 


Qy 


1681 


ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 


1740 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 I i 1 




Db 


97075 


ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 


97134 


Qy 


1741 


GAAGACACATAT GGGGAGTTGGAATT CAAGAAT GAT GAAACTGTAT 178 6 








1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


97135 


GAAGACACATAT G GGGAGT T GGAATT CAAGAAT GAT GAAACT GT GT 97180 
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ALIGNMENTS 



RESULT 1 
ABQ7 88 62 

ID ABQ78862 standard; cDNA; 1863 BP. 
XX 

AC ABQ78862; 
XX 

DT 09-OCT-2002 (first entry) 
XX 

DE Human ion exchanger protein #2 cDNA. 
XX 

KW Human; ion exchanger protein; NHIEP; nootropic; cytostatic; gene therapy; 

KW antiarthritic; virucide; chemotherapeutic; cancer; arthritis; antiviral; 

KW gene; ss; chromosome 14. 
XX 



OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 

FT CDS 1. .1863 

FT /*tag= a 

FT /product= "Ion exchanger protein 2" 
XX 

PN WO200259316-A2. 
XX 

PD 01-AUG-2002. 
XX 

PF 22-JAN-2002; 2002WO-US001817 . 
XX 

PR 23-JAN-2001; 2001US-0263384P . 
XX 

PA (LEXI-) LEXICON GENETICS INC. 
XX 

PI Friddle CJ, Hilbun E; 
XX 

DR WPI; 2002-599791/64. 

DR P-PSDB; ABB81914. 
XX 

PT Novel polynucleotides encoding human ion exchanger proteins that are 

PT structurally related to mammalian sodium- calcium exchanger proteins,. 

PT useful for drug screening, diagnosis and in gene therapy of biological 

PT disorders. 
XX 

PS Disclosure; Page 39-40; 42pp; English. 
XX 

CC The invention relates to a novel human ion exchanger protein (NHIEP) , 

CC that shares structural similarity with mammalian sodium-calcium exchanger 

CC proteins, and potassium dependent versions of the same. The NHIEP of the 

CC invention has nootropic, cytostatic, antiarthritic, and virucide 

CC activity. The polynucleotide may have a use in gene therapy. NHIEPs can 

CC be targeted by drugs, oligos, antibodies etc., in order to treat disease 

CC or to therapeutically augment the efficacy of chemotherapeutic agents 

CC used in the treatment of cancer, arthritis, or as antiviral agents. The 

CC sequence encodes a NHIEP of the invention 

XX 

SQ Sequence 1863 BP; 464 A; 426 C; 514 G; 459 T; 0 U; 0 Other; 

Query Match 100.0%; Score 1863; DB 6; Length 1863; 
Best Local Similarity 100.0%; Pred. No. 0; 

Matches 18 63; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 ACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 121 ACAGGGC AGAAC AAT GAGT C CT GT T CAGGGT CAT C GGACT G CAAG GAG GGT GT CAT CCT G 180 



Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

1 1 I I I I 1 1 1 I I I I I I 1 1 I 1 1 1 1 1 I I I I 1 1 I i I I I I I I I I I I I 1 1 I 1 1 I 1 1 I 1 1 1 1 I I I I I 

Db 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 30 0 

Qy 301 T CT ATT GAAGT CAT CAC CT CT CAAGAGAG GGAG GT GACAATT AAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 T C T AT T GAAGT CAT CAC C T C T CAAGAGAG G G AG GT G AC AAT T AAGAAAC C CAAT G G AGAA 360 

Qy 361 ACCAGCACAAC CACTATT CGGGT CT GGAAT GAAACT GT CT CCAAC CT GACCCTTAT GGCC 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 361 AC CAGC AC AAC CACT AT TCGGGTCTG GAAT GAAACT GT CT CCAAC CT GAC CCT TAT GGCC 42 0 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 48 0 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 54 0 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 481 ATT GCT GGT GAT CTGGGACCTT CTACCATT GTAGGGAGT GCAGCCTT CAACAT GTT CAT C 540 

Qy 541 AT CAT T GGC AT CT GT GT CT AC GT GAT C C C AGAC GGAGAGACT C G CAAGAT CAAGC AT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 AT CATT GGCATCTGT GTCT ACGT GAT CCCAGAC GGAGAGACT CG CAAGAT CAAGCAT CTA 600 

Qy 601 C GAGT C T T CT T CATCACC GCT GCTT G GAGTAT C TTT GC CTACAT CT G GCT CT AT AT GATT 660 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 72 0 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 72 0 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 AT G C AC AAAAAGT AC C G CACAG AC AAAC AC C GAG GAAT TAT CAT AG AGAC AG AG GGT GAC 840 

I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 AT GC AC AAAAAGT AC C GC AC AGAC AAAC AC C GAGGAAT TAT C AT AGAGAC AGAGGGT GAC 840 

Qy 841 CACCCTAAGGGCATTGAGATGGATGGGA7VAATGATGAATTCCCATTTTCTAGATGGGAAC 900 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 841 CACC CT AAG G GC ATT GAGAT GGAT GGGAAAAT GAT GAAT T CC CATTT T CT AGAT GGGAAC 900 

Qy 901 CTGGTGCCCCTG GAAGGGAAGGAAGT GGAT GAGT CC CGC AGAGAGAT GAT C C GGAT T CT C 960 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 CT GGT GCC C CT GGAAGGGAAGGAAGT GGAT GAGT C C CGC AGAGAGAT GAT CC GGAT T CT C 960 

Qy 961 AAGGAT CT GAAGCAAAAAC ACC CAGAGAAGGACTTAGAT C AGCT GGT GGAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 AAG GAT CT GAAG CAAAAAC ACC CAGAGAAGGACTTAGAT CAGCT GGT G GAGAT GGC CAAT 1020 



Qy 



1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 

Db 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 108 0 

Qy 1081 AT GAT GACT GGT GC AGG CAAT AT C CT GAAGAAAC ATGCAGC AGAACAAGC CAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I M I I I I I 

Db 1081 AT GAT GACT GGT GCAGG CAAT AT C CT GAAGAAAC AT GCAGC AGAACAAGC CAAGAAGGC C 1140 

Qy 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1141 T CCAGCAT GAGC GAGGT GCAC AC C GAT GAGC CT G AGGACTT T AT T T C CAAGGT CT T CT TT 1200 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 12 01 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 12 60 

Qy 1261 AAAG GGGGAGACAT GT C AAAG AC CAT GT AT GT GGACT ACAAAACAGAGGAT GGTT CT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 61 AAAGGGGGAGACAT GTCAAAGACCATGTATGT GGACT ACAAAACAGAGGAT GGTT CT GCC 1320 

Qy 1321 AAT GCAGGGGCT GACTAT GAGTT CACAGAGGGCAC GGTGGTT CT GAAGCCAGGAGAGACC 1380 

I I I I I I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 AAT G CAG GGG CT GAC TAT GAGTT CACAGAGGG C AC GGT GGT T CT GAAGCCAGGAGAGAC C 1380 

Qy 1381 C AG AAG G AGT TCTCCGTGGG CAT AAT T GAT GAC GAC AT T T T T GAG GAG GAT G AAC AC T T C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGAAGGAGT T CT C C GT GGG C AT AATT GAT GAC GACAT TT T T GAGGAGGAT GAACACT T C 144 0 

Qy 1441 T TT GTAAGGTT GAGCAAT GT CCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I J I I I I II 

Db 14 41 T TT GT AAGGT T GAGCAAT GT C CG CAT AGAG GAG GAGC AGC CAGAGGAGGG GAT GC CT C CA 1500 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

Qy 1561 GT T AC CAT CT T GG AT GAT GAC CAT G CAG G CAT CT T C AC T T T T GAAT GT GAT ACT AT T CAT 162 0 

I I I I I I I I II I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GT T AC C AT CT T G GAT GAT GAC CAT GC AG GC AT CTT C ACT T T T GAAT GT GAT ACT AT T CAT 1620 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 GT C AGT GAGAGT AT T GGT GT TAT G GAGGT CAAGGTT CT GC G GACAT C AGGT GCC C GGGGT 168 0 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 17 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

Qy 1741 GAAGACACAT AT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GT AT GTGACAGACAGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 17 41 GAAGACACAT AT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GTATGT GACAGACAGGAA 1800 

Qy 1801 GCT GACTAT GGAAGAAGAGGAGG C CAAGAGGAT AGCAGAGAT GGGAAAGC C AGT ATT GGG 18 60 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 1801 GCT GACTAT GGAAGAAGAGGAGGCCAAGAGGAT AGCAGAGAT GGGAAAGC CAGTATT GGG 18 60 

Qy 1861 TGA 1863 

III 



Db 



1861 TGA 1863 
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Query Match , 95.8%; Score 1784.6; DB 6; Length 2766; 

Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1813; Conservative 0; Mismatches 24; Indels 4; Gaps 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 AC AGGG CAGAACAAT GAGT C CT GTT C AGGGT CAT C G GACT GCAAGGAGGGT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 121 AC AGGG CAGAACAAT GAGT C CT GT T C AGGGTCAT C G GACT GCAAGGAGGGT GT CAT C CT G 18 0 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 181 CCAAT CT GGTAC C C GGAGAAC CCTTCCCTT GGGGACAAGATT GC CAGGGT CAT T GT C TAT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 T C T AT T GAAGT CAT C AC C T C T CAAG AG AG G GAG GT G AC AAT T AAG AAAC C C AAT G G AG AA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 301 T CT AT T GAAGTCAT C AC CT CT CAAGAGAG GGAG GTGACAAT T AAGAAAC C CAAT GGAGAA 360 

Qy 361 AC C AGCACAAC C ACT AT T C GG GT CT GGAAT GAAACT GT CT C CAAC CT GAC C CT T AT GGC C 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 AT T GCT GGT GAT CT GG GAC C T T CT AC CAT T GT AGGGAGT G C AGC CT T CAAC AT GT T CAT C 540 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 AT T GCT GGT GAT CT GG GAC CTT CT ACCAT T GT AGGGAGT GC AGCCT T CAACAT GTT CAT C 540 

Qy 541 AT CAT T GGCAT CT GT GT CT ACGT GAT C C CAGAC GGAGAGACT C GCAAGAT CAAGCAT CTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 AT CAT T GG CAT CT GT GT CT ACGT GAT C CCAG AC GGAGAGACT C GCAAGAT CAAGCAT CTA 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I II I I I I I I I II I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 7 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 78 0 



Qy 781 AT GCACAAAAAGT AC C GC ACAGACAAAC AC CGAGGAAT TAT C AT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 

Db 781 ATGCACAAAA&GTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 84 0 

Qy 841 CACCCTAAGGGCATTGAGATGGATGGGAAAATGATGAATTCCCATTTTCTAGATGGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 841 C ACC CT AAGGG CATT GAGAT GGAT GGGAAAAT GAT GAAT T CC CAT T T T CTAGAT GGGAAC 900 

Qy 901 CTGGTGCCCCTG GAAGGGAAGGAAGT GGAT GAGT C C C GC AGAGAGAT GAT C C GGAT T CT C 960 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 901 CTGGTGCCC CT GGAAGGGAAG GAAGT GGAT GAGT C C C GCAGAGAGAT GAT C C GGAT T CT C 960 

Qy 961 AAGGAT CT GAAGCAAAAAC ACC CAGAGAAGGACT T AGAT CAGCT GGT GGAGAT GGC CAAT 1020 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 AAGGAT CT GAAGCAAAAAC AC C CAGAGAAGGACT T AGAT CAGCTGGT GGAGAT GGC CAAT 1020 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 108 0 

Qy 1081 ATGAT GACT GGT GCAGGCAATATCCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 AT GAT GACT GGT GCAGGCAATATCCT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGCC 114 0 

Qy 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1141 T CCAG CAT GAGCGAGGT GC AC AC CGAT GAGC CT GAG GACT TT ATT T C CAAGGT CT T CTT T 1200 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 12 60 

Qy 12 61 AAAGGGGGAGAC ATGT CAAAGAC CAT GT AT GT GGACTACAAAAC AGAG GAT GGTTCT GC C 1320 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 12 61 AAAGGG GGAGAC AT GT CAAAGAC CAT GT ATGT GGACTACAAAACAGAGGAT GGTT CT GC C 1320 

Qy 1321 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 AATGCAGGGGCT GACT AT GAGT TCACAGAGGGCAC GGT GGTT CTGAAGCCAGGAGAGACC 1380 

Qy 1381 CAGAAGGAGTT CT CCGT GGGCATAATT GAT GACGACATTTTT GAGGAGGAT GAACACTT C 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 CAGAAGGAGTT CT C C GT G GGCAT AAT T GAT GAC GACATT T TT GAGGAGGAT GAACACT T C 1440 

Qy 1441 TTT GT AAGGTT GAGCAAT GT CCGCAT AGAGGAGGAGCAGC CAGAGGAGGGGATGCCT CCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

Qy 1561 GTTACCATCTTGGAT GAT GACCAT GCAGGCAT CTTCACTTTT GAAT GT GAT ACTATTCAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 GTTACCAT CTT GGAT GAT GAC CAT GCAGGCAT CTT CACTTTT GAAT GTGATACTATTCAT 1620 



Qy 



1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 

Db 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 168 0 

Qy 1681 ACAGT CAT CGT C C C CTT TAG GAC AGT AGAAG GGACAGC CAAGGGTG GC GGT GAGGACT TT 174 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 ACAGT CAT C GT C C C CTT TAG GACAGT AGAAG GGACAGC CAAGG GT G GC GGT GAGGACTTT 174 0 

Qy 1741 GAAGAC AC AT AT G G GGAGT T G GAATT C AAGAAT GAT GAAAC T GT AT GT GAC AGAC AG GAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1741 GAAGAC AC AT AT G G G G AGT T G GAAT T C AAGAAT GAT GAAAC T GT GAAAAC CAT AAG 1796 

Qy 18 01 GCT GACT AT G GAAGAAGAGGAGGC CAAGAGGAT AGCAGAGA 1841 

I I I I I I I I I I I I I I I I I I I I I I I 

Db 1797 GGT TAAAATAGT AGAT GAG GAGGAAT AC GAAAGGCAAGAGA 1837 
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XX 

CC The invention relates to a novel human ion exchanger protein (NHIEP) , 

CC that shares structural similarity with mammalian sodium-calcium exchanger 

CC proteins / and potassium dependent versions of the same. The NHIEP of the 

CC invention has nootropic, cytostatic, antiarthritic, and virucide 

CC activity. The polynucleotide may have a use in gene therapy. NHIEPs can 

CC be targeted by drugs, oligos, antibodies etc., in order to treat disease 

CC or to therapeutically augment the efficacy of chemotherapeutic agents 

CC used in the treatment of cancer, arthritis, or as antiviral agents. The 

CC sequence represents a mutant form of a NHIEP of the invention. Note: The 

CC present sequence is not shown in the specification but is derived from 

CC the human NHIEP sequence shown as SEQ ID 1 (ABQ7 8861) 
XX 

SQ Sequence 2766 BP; 654 A; 678 C; 761 G; 673 T; 0 U; 0 Other; 



Query Match 95.8%; Score .1784 . 6; DB 6; Length 2766; 

Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1813; Conservative 0; Mismatches 24; Indels 4; Gaps 1; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I U I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 ACAGGGCAGAACAAT GAGTCCT GTTCAGGGT CAT CGGACT GCAAGGAGGGTGT CAT CCT G 18 0 

II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I | | | | 

Db 121 AC AGGG CAGAACAAT GAGT C CT GT T CAGGGTCAT CGGACT GC AAGGAGG GT GT CAT C CT G 18 0 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 TCTATTGAAGTCATCACCTCTCAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 T C T AT T G AAG T CAT C AC C T C T C AAG AG AG G GAG GT GAC AAT T AAG AAAC C C AAT G G AGAA 360 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 48 0 

Qy 481 ATT GCTGGT GAT CTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTT CATC 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 AT T GCT GGT GAT CT GGGAC CTTC T AC CAT T GT AGGGAGT GCAGC CTT CAACAT GTT CAT C ' 54 0 

Qy 541 AT CATT GG C AT CT GT GT CTACGT GAT C C CAGAC GGAGAGACT C GCAAGAT CAAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 541 AT CAT T GG CAT CTGT GT C T AC GT GAT CC CAGAC G GAGAGAC T C GCAAGAT CAAG CAT CT A 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

> I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 C GAGT CTT CTT CAT CACC GCT GC TT G GAGTAT CT T T GC CT AC AT CT GGC T CT ATAT GAT T 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 72 0 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | 
Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 AT GCACAAAAAGTAC CGCACAGACAAACACCGAGGAATT AT CATAGAGACAGAGGGT GAC 84 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 840 

Qy 841 CACCCTAAGGGCATT GAGAT GGATGGGAAAAT GAT GAATT CCCATTTTCTAGATGGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 C AC CCTAAG GGC ATT GAGAT G GAT GGGAAAAT GAT GAAT T CC CAT T T T CTAGAT GG GAAC 900 

Qy 901 CT GGT GC CC CT G GAAG G GAAGGAAGT GGAT GAGT C C C GC AGAGAGAT GAT C C GGAT T CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTCTC 960 

Qy 961 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCTGGTGGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGGAT CTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGT GGAGAT GGCCAAT 1020 

Qy 1021 T AC TAT GCTCTTTCC C AC C AAC AG AAG AG CCGCGCCTT CT AC C GT AT C CAAG C C AC T C GT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 108 0 

Qy 1081 AT GAT GACT GGT GCAGGCAATAT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 AT GAT GACT GGT GCAGGCAATAT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

Qy 1141 T C C AGC ATGAGC GAGGT GC ACAC C GAT GAGC CT GAGGACT T T AT TT C CAAGGT CTT CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGT CTT CTTT 1200 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | I I | | | | | | | | | | | | 
Db 1201 GAC CCAT GT T CT TAC CAGT GCCT GGAGAACT GT G GG GCT GT ACT CCT GAC AGT GGT GAGG 1260 

Qy 1261 AAAGGGGGAGAC ATGT CAAAGAC CAT GTAT GT GGACTACAAAACAGAGGAT GGTT CT GCC 1320 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 AAAGG GGGAGAC AT GT CAAAGAC CAT GTAT GT GGACTACAAAACAGAGGAT GGT T CT GC C 132 0 

Qy 1321 AAT GC AGGGGCT GACT AT GAGTT CAC AGAGGGCAC GGTGGTT C T GAAGC C AGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1321 AAT GC AGGGGCT GACTAT GAGTT CAC AGAGGG CAC GGT GGT T CT GAAGCC AGGAGAGAC C 1380 



Qy 1381 CAGAAG GAGT T CT C CGT GGGCAT AAT T GAT GAC GACATT T TT GAGGAG GAT GAACACT T C 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | I I I I I I I I I I I I 

Db 1381 CAGAAGGAGT T CT C CGT GG GCATAAT T GAT GACGAC ATTT T T GAGGAGGAT GAACACT T C 144 0 



Qy 1441 T T T GTAAG GT T GAGCAAT GT C C GCAT AGAGGAGGAGC AGCCAGAGGAGGGGAT GC CT C CA 1500 

I I I Ml I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1441 T T T GT AAGGTT GAG CAAT GTC C GC AT AGAGGAGGAGCAGC CAGAGGAGG GGATGC CT C CA 1500 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

Qy 1561 GTTACCAT CTTGGAT GAT GAC CATGCAGGCAT CTT CACTTTT GAAT GTGATACTATTCAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 GTTACCAT CTTGGAT GAT GAC CATGCAGGCAT CTT CACTTTTGAAT GT GATACTATTCAT 1620 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 ACAGT CAT C GT C C C CT TT AGGACAGT AGAAGG GAC AGC CAAGGGT GGC GGT G AGGACTT T 174 0 

Qy 1741 GAAGACAC ATAT GGG GAGT T GGAATT C AAGAAT GAT GAAACT GT AT GT GACAGAC AGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1741 GAAGACAC AT AT GGGGAGT T G GAAT T CAAGAAT GAT GAAAC T GT GAAAAC C AT AAG 17 96 

Qy 1801 GCTGACTATGGAAGAAGAGGAGGCCAAGAGGATAGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 

Db 1797 GGT T AAAAT AGT AGAT GAG GAGGAAT AC GAAAGGCAAGAGA 1837 
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ABQ78866 
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XX 

AC ABQ78866; 
XX 
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XX 



DE Human ion exchanger protein #1 cDNA A/G+GCA mutant. 
XX 

KW Human; ion exchanger protein; NHIEP; nootropic; cytostatic; gene therapy; 
KW antiarthritic; virucide; chemotherapeutic; cancer; arthritis; antiviral; 
KW gene; ss; mutant. 
XX 

OS Homo sapiens. 
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XX 
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XX 
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XX 

PD 01-AUG-2002. 
XX 
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XX 

PR 23-JAN-2001; 2001US-0263384P . 
XX 

PA (LEXI-) LEXICON GENETICS INC. 
XX 

PI Friddle CJ, Hilbun E; 
XX 

DR WPI; 2002-599791/64. 
XX 

PT Novel polynucleotides encoding human ion exchanger proteins that are 

PT structurally related to mammalian sodium- calcium exchanger proteins , 

PT useful for drug screening, diagnosis and in gene therapy of biological 

PT disorders. 
XX 

PS Disclosure; Page; 42pp; English. 
XX 

CC The invention relates to a novel human ion exchanger protein (NHIEP) , 

CC that shares structural similarity with mammalian sodium- calcium exchanger 

CC proteins , and potassium dependent versions of the same. The NHIEP of the 

CC invention has nootropic, cytostatic, antiarthritic, and virucide 

CC activity. The polynucleotide may have a use in gene therapy. NHIEPs can 

CC be targeted by drugs, oligos, antibodies etc., in order to treat disease 

CC or to therapeutically augment the efficacy of chemotherapeutic agents 



CC used in the treatment of cancer, arthritis, or as antiviral agents. The 

CC seguence represents a mutant form of a NHIEP of the invention. Note: The 

CC present sequence is not shown in the specification but is derived from 

CC the human NHIEP sequence shown as SEQ ID 1 (ABQ78861) 
XX 

SQ Sequence 2769 BP; 655 A; 679 C; 762 G; 673 T; 0 U; 0 Other; 



Query Match 95.8%; Score 1784.6; DB 6; Length 2769; 

Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1813; Conservative 0; Mismatches 24; Indels 4; Gaps 1; 



Qy 


l 


ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 


60 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I I I I I | | | | I | fl | 




Db 


i 


ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 


60 


Qy 


61 


TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 


120 






1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 | | | | | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


61 


TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 


120 


Qy 


121 


ACAGGGCAGAACAAT GAGTC CT GT T CAGGGT CAT C GGACT G CAAG GAG GGT GT C AT CCTG 


180 






1 1 1 1 M 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


121 


AC AG GGC AGAACAAT GAGT CCT GT T CAGGGT CAT C GGACT GCAAGGAGGGT GTC AT CCT G 


180 


Qy 


181 


CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 


240 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 I I I I I I I 




Db 


181 


CC^iATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 


240 


Qy 


241 


TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 


300 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I | | | | | | 




Db 


241 


TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 


300 


Qy 


301 


T CTATTGAAGTCAT CACCTCT CAAGAGAGGGAGGT GACAATTAAGAAACCCAATGGAGAA 


360 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 



Db 301 T CT AT T GAAGT CAT C AC CT CT CAAGAGAGGGAGGT GACAATT AAGAAAC C CAAT GGAGAA 360 

Qy 361 AC C AGC ACAAC C AC TAT T C G GGT CT GGAAT GAAACT GT CTC CAAC CT GAC C CT T AT G GC C 420 

I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 ATT GCT GGT GAT CT GGGACCTT CT ACCATT GTAGGGAGT GCAGCCTT CAACAT GTTCAT C 540 

I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 AT T GCT GGT GAT CT GG GACCT T CT ACCATT GTAGGGAGT GCAG C CT T CAACAT GTT CATC 54 0 

Qy 541 AT C ATT GGCAT CT GT GT CTACGT GAT C C CAGAC G GAGAGACT C GCAAGAT CAAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 AT CATT GGCAT CT GT GT CTAC GT GAT C C CAGAC G GAGAGACT C GCAAGAT CAAGCAT CT A 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTAT CATAGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 AT GCACAAAAAGT ACC GCAC AGACAAAC AC C GAGGAATT AT CATAGAGACAGAGGGT GAC 840 

Qy 841 CACCCTAAGGGCAT T GAGAT GGAT GGGAAAAT GAT GAATT CCCATTTT CTAGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CACCCTAAGGGCAT TGAGAT GGAT GGGAAAATGATGAATT CCCATTTTCTAGAT GGGAAC 900 

Qy 901 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTCTC 960 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 CT GGT G C CC CT GGAAGGGAAGGAAGT G GAT GAGT CC C GCAGAGAGAT GAT C C GGATT CT C 960 

Qy 961 AAGGAT CT GAAGCAAAAACACC CAGAGAAGGACTTAGAT CAGCT GGT GGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I 

Db 961 AAGGAT CT GAAGCAAAAACACC CAGAGAAGGACTTAGAT CAGCT GGT GGAGAT GGCCAAT 1020 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

Qy 1081 AT GATGACTGGTGCAGGCAATAT CCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 AT GATGACT GGTGCAGGCAAT AT CCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

Qy 1141 T C CAG CAT GAGC GAGGT GCAC AC C GAT GAGC CT GAGGACT T TAT T T C CAAG GTCTTCTTT 1200 

I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 T C CAG CAT GAGC GAGGT GCACAC C GAT GAGC CT GAGGACT T T AT TT C CAAGGT CT T C T TT 1200 



Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 01 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

Qy 1261 AAAGGGGGAGACAT GT CAAAGACCAT GTAT GT GGACTACAAAACAGAGGAT GGTT CT GCC 1320 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1261 AAAGGG GGAGACAT GT CAAAGACCAT GTAT GT GGACT ACAAAACAGAG GAT GGTTCTGCC 1320 

Qy 1321 AAT G CAGGGGCT GACTAT GAGT T C ACAGAGGGCAC GGT GGT T CT GAAG C CAG GAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 AAT GCAGGGGCT GACTAT GAGT T C ACAGAGGGCAC GGT GGT T CT GAAG C CAG GAGAGAC C 1380 

Qy 1381 C AGAAG GAGT T CT C CGT GGGC AT AAT T GAT GAC GAC AT T T T T G AGGAG GAT GAAC ACT T C 1440 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 CAGAAGGAGTT CTCCGT GGGCATAATTGATGACGACATTTTT GAGGAGGAT GAACACTT C 1440 

Qy 1441 T T T GTAAGGT T GAG CAAT GT C C GC AT AGAGGAGGAGC AGCCAGAGGAG GGGAT GC CT C CA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 T TT GTAAGGTT GAGCAAT GT C C GC AT AGAGGAGGAGCAGC CAGAGGAG G GGAT GC CT C CA 1500 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

Qy 1561 GT T AC CAT CTT GGAT GAT GAC C AT GC AGGC AT CT T C ACT T TT GAAT GT GAT ACT AT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GTTACCAT CTT GGAT GATGACCAT GCAGGCAT CTT CACTTTTGAATGT GATACTATTCAT 1620 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

Qy 1681 AC AGT CAT C GT C C C CT T TAG GAC AGT AGAAGGGACAGC C AAGGGT G G C GGT GAG GACTT T 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 ACAGT CAT CGT CC C CTT T AGGACAGT AGAAGG GACAGCCAAG GGT GGC GGT GAGGACTT T 174 0 

Qy 17 41 GAAGAC AC AT AT GG GGAGT T G GAAT T CAAGAAT GAT GAAACT GTAT GT GACAGAC AG GAA 1800 

I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II II I II I 

Db 1741 GAAGACACATAT GGGGAGTT GGAATTCAAGAAT GAT GAAAC T GT GAAAAC C AT AAG 1796 

Qy 18 01 GCT GACTAT G GAAGAAGAGGAG GC CAAGAGGAT AGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 

Db 17 97 GGTTAAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGA 1837 



RESULT 5 
ABQ78865 

ID ABQ78865 standard; cDNA; 2769 BP. 
XX 

AC ABQ78865; 
XX 

DT 09-OCT-2002 (first entry) 
XX 

DE Human ion exchanger protein #1 cDNA GCA mutant. 
XX 

KW Human; ion exchanger protein; NHIEP; nootropic; cytostatic; gene therapy; 



KW antiarthritic; virucide; chemotherapeutic; cancer; arthritis; antiviral; 

KW gene; ss; mutant, 

XX 

OS Homo sapiens. 

OS Synthetic. 
XX 

FH Key Location/Qualifiers 

FT mutation replace (2113 . .2115,-) 

FT /*tag= a 
XX 

PN WO200259316-A2. 
XX 

PD 01-AUG-2002. 
XX 

PF 22-JAN-2002; 2002WO-US001817 . 
XX 

PR 23-JAN-2001; 2001US-0263384P . 
XX 

PA (LEXI-) LEXICON GENETICS INC. 
XX 

PI Friddle CJ, Hilbun E; 
XX 

DR WPI; 2002-599791/64. 
XX 

PT Novel polynucleotides encoding human ion exchanger proteins that are 

PT structurally related to mammalian sodium- calcium exchanger proteins, 

PT useful for drug screening, diagnosis and in gene therapy of biological 

PT disorders. 
XX 

PS Disclosure; Page; 42pp; English. 
XX 

CC The invention relates to a novel human ion exchanger protein (NHIEP) , 

CC that shares structural similarity with mammalian sodium-calcium exchanger 

CC proteins, and potassium dependent versions of the same. The NHIEP of the 

CC invention has nootropic, cytostatic, antiarthritic, and virucide 

CC activity. The polynucleotide may have a use in gene therapy. NHIEPs can 

CC be targeted by drugs, oligos, antibodies etc., in order to treat disease 

CC or to therapeutically augment the efficacy of chemotherapeutic agents 

CC used in the treatment of cancer, arthritis, or as antiviral agents. The 

CC sequence represents a mutant form of a NHIEP of the invention. Note: The 

CC present sequence is not shown in the specification but is derived from 

CC the human NHIEP sequence shown as SEQ ID 1 (ABQ78861) 
XX 

SQ Sequence 2769 BP; 656 A; 679 C; 761 G; 673 T; 0 U; 0 Other; 

Query Match 95.8%; Score 1784.6; DB 6; Length 2769; 
Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1813; Conservative 0; Mismatches 24; Indels 4; Gaps 1; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 



Qy 121 ACAGG GCAGAACAAT GAGT CCT GT T CAGG GT CAT C GGACT GCAAGGAG G GT GT CAT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 ACAGGGCAGAACAAT GAGT CCT GT T CAGG GT CAT C GGACT GCAAGGAGG GT GT CAT CCT G 180 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 C CAAT CT GGT AC C C GGAGAAC CCTTCCCTT G GGGACAAGAT T GCCAGGGT C ATT GT CTAT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 T CTATT GAAGT CATCACCT CT CAAGAGAGGGAGGT GACAATT AAGAAACCCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 T CTAT T GAAGT CAT C ACCT CT CAAGAGAG GGAGGT GACAAT TAAGAAAC CCAAT GGAGAA 360 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 AC CAG CACAAC CACT AT T C GGGT CT GGAAT GAAACTGT CT C CAAC CT GACC CTT AT GG C C 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 81 ATT GCTGGT GAT CT GGGACCT T CT ACCAT T GTAGGGAGT GC AGC CT T CAAC AT GT T CAT C 540 

Qy 541 AT CAT T G G CAT CT GT GT CT AC GTGAT CC CAGAC GGAGAGACT CGCAAGAT CAAGCAT CT A 600 

I I I ! I I I I I I I I I I I I I I II I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 AT CAT T GGCAT CT GT GT CTAC GT GATCC CAGACGGAGAGACT CGCAAGAT CAAG C AT CT A 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 601 C GAGT CTT CTT CAT CACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCT CTAT AT GATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I II I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 7 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 ATGCACA7WVAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 81 ATGCACAAAAAGT AC CGCAC AGACAAAC AC C GAGGAAT TAT C AT AGAGAC AGAGG GT GAC 8 40 

Qy 841 CACCCTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATTCCCATTTT CTAGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 C AC C C TAAGGG CAT T GAGAT GGAT GGGAAAAT GAT GAATT C C CAT TT T CTAGAT GGGAAC 900 

Qy 901 CTGGT GCCCCT GGAAGGGAAGGAAGT GGAT GAGT CCC GCAGAGAGATGATCCGGATTCT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 CTGGTGCCCCT GGAAGGGAAGGAAGTGGAT GAGT CCCGCAGAGAGAT GATCCGGATT CTC 960 

Qy 961 AAGGAT CT GAAGCAAAAACAC CC AGAGAAG GACT T AGATC AGCT GGT GGAGAT G GCCAAT 1020 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 961 AAGGAT CT GAAGCAAAAACACC CAGAGAAGGACT T AGAT CAGCTGGT GGAGAT GGC CAAT 1020 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

Qy 1081 AT GAT GACT G GT GC AGGCAATAT CCT GAAGAAAC AT GCAGCAGAAC AAGC CAAGAAG GC C 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAAC AT GCAG CAGAACAAG C CAAGAAGGC C 114 0 

Qy 1141 TCCAGCATGAGCGAGGT GCACACCGAT GAGCCT GAGGACTTTATTT C CAAGGT CTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

Qy 12 01 GAC CCAT GT T CTT ACCAGT GCCT GGAGAACT GT GGG G CT GTACT C CT GACAGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

Qy 12 61 AAAGGGGGAGACATGTCAAAGACCATGTATGTGGACTACAAAACAGAGGATGGTTCTGCC 132 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 12 61 AAAGGGGGAGAC AT GT CAAAGAC CAT GT AT GT G GACT ACAAAACAG AGGAT G GT T CT GC C 1320 

Qy 1321 AAT GC AGGG G CT GACT AT GAGT T C AC AGAGG GCAC G GT GGT T CT GAAG C CAGGAGAGAC C 1380 

I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 AAT GCAGG GGCT GACT AT GAGT T CAC AGAG GGC ACGGT GGTT CT GAAGC CAGGAGAGAC C 1380 

Qy 13 81 C AGAAGGAGT T CT CC GT GG GCAT AAT T GAT GAC GAC ATT T TT GAGGAGGAT GAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGAAGGAGTTCT CCGTGGGCATAATT GAT GACGACATTTTT GAGGAGGATGAACACTT C 1440 

Qy 1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 TTT GTAAGGTTGAGCAATGT CCGCATAGAGGAGGAGCAGCCAGAGGAGGGGAT GCCT CCA 1500 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

Qy 1561 GT T AC CAT CT T GGAT GAT GACC AT GCAG GCAT CTT C ACT T TT GAAT GT GAT ACT AT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GTTACCAT CTTGGAT GAT GACCATGCAGGCAT CTT CACTTTT GAAT GT GAT ACT ATT CAT 1620 

Qy 1621 GT CAGT GAGAGT ATT GGT GT TAT GGAGGT CAAGGTT CT GCGGACAT CAG GTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 GT CAGT GAGAGT ATT G GT GT TAT GGAGGT CAAG GT T CT GC GGACAT CAGGT GC CC GGGGT 1680 

Qy 1681 ACAGT CAT C GT C C C CT TT AGGACAGT AGAAGGGAC AGC CAAGGGT G GCGGT GAGGACTT T 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 ACAGT CAT C GT C C CCT TT AGGACAGT AGAAGGGAC AGC CAAGGGT GGC GGT GAG GACTT T 1740 

Qy 1741 GAAGACAC AT AT GGG GAGT T G GAAT T CAAGAAT GAT GAAACT GT AT GT GACAGACAGGAA 1800 

II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I II I 

Db 1741 GAAGACAC AT AT G G GGAGTT GGAAT T CAAGAAT GAT GAAAC T GT GAAAAC C AT AAG 1796 

Qy 1801 GCT GACT AT GGAAGAAGAGGAG GC CAAGAGGAT AG CAGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 



Db 1797 GGT TAAAAT AGT AGAT GAG GAGGAAT ACGAAAGGCAAGAGA 1837 



RESULT 6 
ABQ78863 

ID ABQ78863 standard; cDNA; 3812 BP. 
XX 

AC ABQ788 63; 
XX 

DT 09-OCT-2002 (first entry) 
XX 

DE Human ion exchanger protein cDNA #3. 
XX 

KW Human; ion exchanger protein; NHIEP; nootropic; cytostatic; gene therapy; 

KW antiarthritic; virucide; chemotherapeutic; cancer; arthritis; antiviral; 

KW gene; ss; chromosome 14. 
XX 

OS Homo sapiens . 
XX 

PN WO200259316-A2. 
XX 

PD 01-AUG-2002. 
XX 

PF 22-JAN-2002; 2002WO-US0018 17 . 
XX 

PR 23-JAN-2001; 2001US-0263384P . 
XX 

PA (LEXI-) LEXICON GENETICS INC. 
XX 

PI Friddle CJ, Hilbun E; 
XX 

DR WPI; 2002-599791/64. 
XX 

PT Novel polynucleotides encoding human ion exchanger proteins that are 

PT structurally related to mammalian sodium- calcium exchanger proteins, 

PT useful for drug screening, diagnosis and in gene therapy of biological 

PT disorders . 
XX 

PS Disclosure; Page 41-42; 42pp; English. 
XX 

CC The invention relates to a novel human ion exchanger protein (NHIEP) , 

CC that shares structural similarity with mammalian sodium-calcium exchanger 

CC proteins, and potassium dependent versions of the same. The NHIEP of the 

CC invention has nootropic, cytostatic, antiarthritic, and virucide 

CC activity. The polynucleotide may have a use in gene therapy. NHIEPs can 

CC be targeted by drugs, oligos, antibodies etc., in order to treat disease 

CC or to therapeutically augment the efficacy of chemotherapeutic agents 

CC used in the treatment of cancer, arthritis, or as antiviral agents. The 

CC sequence encodes a NHIEP of the invention, with regions of flanking 

CC sequence 

XX 

SQ Sequence 3812 BP; 860 A; 1059 C; 1041 G; 852 T; 0 U; 0 Other; 

Query Match 95.8%; Score 1784.6; DB 6; Length 3812; 
Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1813; Conservative 0; Mismatches 24; Indels 4; Gaps 1; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 618 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 677 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I 1 1 I I I 1 1 I 1 1 1 I I 1 1 1 1 1 i I I I 1 1 I I I I I I I 1 1 1 1 1 1 1 1 1 I I I I 1 1 I I I I I 

Db 678 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 737 

Qy 121 AC AGGGCAGAACAAT GAGT C CT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT CCT G 18 0 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I II I I I 

Db 738 AC AGGGCAGAACAAT GAGT CCT GTT C AGG GT CAT C G GACT GC AAGGAGG GT GT CAT C CT G 797 

Qy 181 CCAAT CT GGT AC C CGGAGAACCCTT CCCTT GGGGACAAGATT GCCAGGGT CATT GT CTAT 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 798 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 857 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 858 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 917 

Qy 301 T CT AT T GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAATT AAGAAAC C C AAT GGAGAA 360 

I I II II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II 

Db 918 T CT ATT GAAGT CAT CACCT CTCAAGAGAGGGAGGT GACAATT AAGAAAC CCAAT GGAGAA 977 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 978 AC CAGCACAACC ACT ATT C GGGT CT G GAAT GAAACT GT CT CCAAC CT GAC CCT TAT GGC C 1037 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1038 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 10 97 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 54 0 

I I I I I I I I I I I I I I I I I 1 1 I I I I i I I I I I I I 1 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1098 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 1157 

Qy 541 AT CAT T GGC AT CT GT GT CTAC GT GAT C C C AGAC G GAGAGACT C GC AAGAT CAAGC AT CT A 600 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1158 AT CATT GGCATCTGT GTCTACGT GATCCCAGACGGAGAGACT CGCAAGAT CAAGCATCT A 1217 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 1218 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1277 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 1278 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1337 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1338 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1397 

Qy 7 81 AT G C AC AAAAAGT AC C G C AC AG AC AAAC AC C GAG GAAT TAT C AT AG AG ACAG AGG GT GAC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1398 AT GC AC AAAAAGT AC C G C AC AGAC AAAC AC C GAG GAAT TAT C AT AG AG AC AGAG GGT GAC 1457 



QY 



841 C ACCCT AAG GGCAT T GAGAT GGAT G G GAAAAT GAT GAAT T C C CAT T TT CT AGAT G GGAAC 900 



Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 58 C AC C CT AAGGGCAT T GAGAT GGAT GGGAAAAT GAT GAATT C C CAT TT T CTAGAT G GGAAC 1517 



Qy 901 CTGGTGCCCCT GGAAGG GAAGGAAGT GGAT GAGT C CC GCAGAGAGAT GAT C C GGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1518 CTGGTGCCCCT GGAAGGGAAGGAAGTGGATGAGT CCC GCAGAGAGAT GATC CGGATTCT C 1577 

Qy 961 AAG GAT C T G AAG C AAAAAC AC C C AG AG AAG GAC T TAG AT C AG C T G GT G GAGAT G G C C AAT 1020 

I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1578 AAG GAT CT GAAG CAAAAACAC CCAGAGAAGGACT T AGAT C AGCT G GT GGAGAT GGCCAAT 1637 

Qy 1021 TACT AT GCTCTTTCC C AC CAAC AGAAGAG CCGCGCCTT CT AC C GT AT C C AAGC CACT C GT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1638 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1697 

Qy 1081 AT GAT GACT G GT GCAGGCAAT AT C CT GAAGAAACAT GC AGC AGAACAAGCC AAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1698 AT GAT GACT G GT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAG CCAAGAAGGC C 1757 

Qy 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1758 T C CAG CAT GAG C GAG GT GCAC ACC GAT GAGC CT GAGGACTT T AT T T C CAAGGT CT T CT T T 1817 

Qy 12 01 GAC C CAT GT T C T T AC C AGT G C CT G GAGAACT GT G G GG C T GT ACT C C T GAC AGT G GT GAG G 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1818 GACC CAT GTTCT T AC CAGT GC CT GGAGAACT GT G GGGCT GT ACT C CT GACAGT GGT GAGG 1877 

Qy 1261 AAAGGGGGAGACATGTCAAAGACCATGTATGTGGACTACAAAACAGAGGATGGTTCTGCC 1320 

I I I I I I II I I I I I II I I I I I II I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I 

Db 1878 AAAGGGGGAGACAT GT C AAAGACC AT GT AT GT GGACTACAAAACAGAGGAT GGT T C T GCC 1937 

Qy 1321 AAT GCAGGGGCT GACTAT GAGTT CACAGAGG GCAC GGT GGTT CT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1938 AAT GCAGGGGCT GACTAT GAGTT CACAGAGG GCAC GGT GGT TCT GAAGCCAGGAGAGACC 1997 

Qy 1381 C AGAAGGAGT T CT C C GT G GGCAT AAT T GAT GAC GAC AT T T T T GAGGAGGAT GAACACT T C 1440 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1998 CAGAAGGAGTTCTC CGT GGGCATAATTGATGACGACATTTTT GAGGAGGAT GAACACT T C 2057 

Qy 1441 T T T GTAAGGTT GAG CAAT GT C C GC AT AGAGGAGGAGCAGCC AGAGGAGGGGAT G C CT C CA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2058 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 2117 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2118 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 2177 

Qy 1561 GTTACCAT CTT GGAT GAT GACCAT GCAGGCAT CTT CACT TTT GAAT GTGATACTATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2178 GTT AC CAT CT T GGAT GAT GAC CAT GCAGG C AT CT T CACTTT T GAAT GT GAT ACT AT T CAT 2237 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2238 GT CAGT GAGAGT AT T GGT GTT AT GGAGGT CAAGGT TCT GCGGAC AT CAGGT G C C C GGG GT 2297 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I II I I I I I I I I I I I I I I I I I 



Db 2298 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 2357 



Qy 1741 GAAGACAC AT AT GGG GAGT T GGAAT T CAAGAAT GAT GAAACT GT AT GT GACAGAC AGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I 

Db 2358 GAAGACACAT AT G GG GAGT T GGAATT CAAGAAT GAT GAAAC T GT GAAAAC C AT AAG 2413 

Qy 1801 GCTGACTATGGAAGAAGAGGAGGCCAAGAGGATAGCAGAGA 1841 

III I I I II I I I I I I I I I I I I I I I 

Db 2414 GGT T AAAAT AGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGA 2454 



RESULT 7 
ACC00414 

ID ACC00414 standard; cDNA; 2534 BP. 
XX 

AC ACC00414; 
XX 

DT 04-JUL-2003 (first entry) 
XX 

DE Human 69039 coding sequence. 
XX 

KW Human; 69039; neuroprotective; gene therapy; haematopoietic disorder; 

KW Na+/Ca2+ exchanger; ion transporter; neural tissue; 

KW neurological disorder; gene; ss. 
XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 

FT CDS 343. .2130 

FT /*tag= a 

FT /product= "Human 69039" 

XX 

PN WO2003029410-A2. 
XX 

PD 10-APR-2003. 
XX 

PF 27-SEP-2002; 2002WO-US030817 . 
XX 

PR 28-SEP-2001; 2001US-0325737P . 
XX 

PA (MILL-) MILLENIUM PHARM INC. 

XX 

PI Carroll JM; 
XX 

DR WPI; 2003-381617/36. 

DR P-PSDB; ABR40134. 
XX 

PT Identifying a nucleic acid molecule associated with a disorder for 

PT preparing a composition for treating hematopoietic or neurological 

PT disorder by detecting the presence of a nucleic acid molecule in the 

PT sample that is amplified. 
XX 

PS Claim 1; Page 109-110; 133pp; English. 
XX 

CC The present sequence is the coding sequence for human 69039, a novel 

CC Na+/Ca2+ exchanger family member (ion transporter) . 69039 was shown to be 

CC expressed in human haematopoietic cells, e.g. CD34-expressing progenitor 



CC cells as well as in neural tissues, e.g. brain cortex and hypothalamus. 

CC 69039 may therefore be used for preparing a composition for treating 

CC haematopoietic or neurological disorder 
XX 

SQ Sequence 2534 BP; 602 A; 595 C; 644 G; 693 T; 0 U; 0 Other; 

Query Match 95.8%; Score 1784.4; DB 7; Length 2534; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1785; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I II I I I 
Db 343 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 402 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 403 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 462 

Qy 121 AC AG GGCAGAACAAT GAGT CCT GT T C AGGGT CAT CGGACT G CAAGGAG GGT GTCATC CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 4 63 ACAGGG CAGAACAATGAGT C CT GT T CAGGGT CAT CGGACT GCAAG GAG GGT GT CATC CT G 522 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 523 C CAAT CT GGT ACC C GGAGAAC C CT T C C CTT G GGGACAAGAT T GC CAGGGT C ATT GT CT AT 582 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 583 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 642 

Qy 301 T CTATTGAAGTCATCACCTCT CAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 643 T CTATTGAAGT CATCACCTCT CAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 7 02 

Qy 361 AC CAGC AC AAC CACT AT T C GG GT C T GGAAT GAAACT GT CT C CAAC CT GAC C CTT AT G GC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 703 AC CAGCACAAC CACT AT T CGG GTCT GGAAT GAAACT GT CT C CAAC CT GAC C CTT AT G GCC 762 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 63 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 822 

Qy 4 81 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 823 ATT GCT GGT GAT CTGGGACCTTCTACCAT T GTAGGGAGT GCAGCCTT CAACAT GTT CAT C 882 

Qy 541 AT CATT GGCATCT GT GTCT AC GT GAT C CCAGACGGAGAGACT CGCAAGAT CAAGCATCTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8 83 AT C ATT GGCAT CT GTGT C T AC GT GAT C C CAGAC GGAGAGACT CGCAAGAT CAAGCAT CTA 942 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 943 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1002 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1003 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1062 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1063 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1122 



781 



840 



AT GCACAAAAAGT AC C GCAC AGACAAAC ACC GAGGAAT TAT CAT AGAGACAGAGGGT GAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1123 AT GCACAAAAAGT AC CGCAC AGACAAAC AC C GAG GAATT AT CAT AGAGACAGAGGGT GAC 1182 



841 



900 



C AC C CT AAGG GCAT T GAGAT GGAT GGGAAAAT GAT GAAT T CC C ATT T T C T AGAT GGGAAC 
I I I I I I II I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I 
1183 C AC C CT AAG G GCAT T GAGAT G GAT G GGAAAAT GAT GAAT T CC CATT T T CT AGAT GGGAAC 1242 



901 



960 



CT GGTGC C C C T GGAAGGGAAG GAAGT GGAT GAGT C C CG C AGAGAGAT GAT C C GGAT T CT C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
1243 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTCTC 1302 

961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGATGGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1303 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTT AGAT CAGCTGGT GGAGAT GGCCAAT 1362 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
1363 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1422 

1081 AT GAT GACT GGT GCAGGCAATAT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
1423 AT GAT GACT GGT G C AGGCAAT AT CCT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGCC 1482 

1141 T C C AG CAT GAG C GAG GT G C AC AC C GAT GAG CCT GAG GAC T T T AT T T C C AAG GT C T T CT T T 1200 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

1483 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1542 

1201 GAC C CAT GTT CT T ACCAGTGC CT GGAGAACT GT GGG GCT GTACT CCT GAC AGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1543 GACCCAT GTT CTTACCAGTGCCT GGAGAACT GT GGGGCT GTACT CCT GAC AGT GGT GAGG 1602 

1261 AAAGGGGGAGACATGT CAAAGAC CAT GTATGT GGACT ACAAAACAGAGGAT GGTTCT GCC 1320 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1603 AAAGGGGGAGACAT GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGAT GGT T CT GCC 1662 

1321 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAT GCAGGGGCTGACTAT GAGTTCACAGAGGGCACGGTGGTT CT GAAGCCAGGAGAGACC 



1663 



1722 



1381 CAGAAGGAGT T CT C C GT G GGCATAAT T GAT GAC GAC ATT T TT GAGGAGGAT GAACACT T C 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

1723 C AGAAG GAGT T CT CC GT G GGCATAAT T GAT GAC GACATT T TT GAGGAGGAT GAACACT T C 1782 

1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I 

1783 TTT GTAAGGTT GAGCAAT GTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGAT GCCT CCA 1842 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1843 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1902 



Qy 1561 GT T AC CAT CT T G GAT GAT GAC CAT G C AG G CAT CT T C AC T T T T GAAT GT GAT AC TAT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I U I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1903 GTTACCAT CTT GGAT GAT GAC CAT GCAGGCAT CTT CACTTTTGAATGT GATACTATT CAT 1962 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 19 63 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 2022 

Qy 1681 AC AGT CAT CGTCCCCTT TAG G ACAGT AGAAG GGAC AG C C AAG GGTGGCGGT GAG GAC T T T 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2023 ACAGT C AT CGT CC C CTT TAG GACAGT AGAAG GGAC AG C CAAGGGT GGC GGT GAG GACTT T 2082 

Qy 1741 G AAG AC AC AT AT G G G GAGT T G GAAT T C AAG AAT GAT G AAAC T G TAT 1786 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 2083 GAAGAC AC AT AT G G G GAGT T G GAAT T C AAGAAT GAT GAAAC T GT GT 2128 



RESULT 8 
ABA04756 

ID ABA04756 standard; cDNA; 2781 BP. 
XX 

AC ABA04756; 
XX 

DT 25-FEB-2002 (first entry) 
XX 

DE Human natrium ( + ) -calcium ( 2 + ) exchanger form 3 protein, HNCX3, cDNA. 
XX 

KW Human; Natrium ( + ) -Calcium (2-1- ) exchanger form 3; HNCX3; chromosome 14; 

KW cardiac failure; myocardial infarction; cardiac hypertrophy; arrhythmia; 

KW myocarditis; pulmonary hypertension; cardiotoxicity; cardiant; Vaccine; 

KW coronary heart disease; renal failure; ischaemic disorder; 

KW Antiarrhythmic; Vasotropic; Hypotensive; cardiovascular disorder; ss. 

XX 

OS Homo sapiens. 



XX 

FH Key Location/Qualif iers 

FT CDS 1. .2781 

FT /*tag= a 

FT /partial 

FT /product= "Human natrium(+) -calcium(2+) exchanger form 3 

FT protein, HNCX3" 

FT /note= "No stop codon given" 

XX 



PN WO200183744-A2. 
XX 

PD 08-NOV-2001. 
XX 

PF 30-APR-2001; 2001WO-EP004886 . 
XX 

PR 02-MAY-2000; 2000EP-00109080 . 
XX 

PA (MERE ) MERCK PATENT GMBH. 
XX 

PI Wilm C; 
XX 

DR WPI; 2002-041493/05. 

DR P-PSDB; AAM47745. 



XX 

PT New polypeptide, useful as vaccines for inducing immune response against 

PT diseases such as myocardial infarction, arrhythmia, ischemic disorders, 

PT renal disorders in mammal. 
XX 

PS Claim 4; Page 34-38; 41pp; English. 
XX 

CC The present sequence is the coding sequence for human Natrium (+) -Calcium 

CC (2+) exchanger form 3 (HNCX3) . The HNCX3 gene maps to human chromosome 

CC 14. HNCX3 and its coding sequence are useful for treating acute and 

CC chronic cardiac failure of different aetiologies, myocardial infarction, 

CC cardiac hypertrophy, arrhythmia, myocarditis, pulmonary hypertension, 

CC cardiotoxicity (e.g. induced by chemotherapy), coronary heart disease, 

CC acute and chronic renal failure, ischaemic disorders of skeletal muscle 

CC and ischaemic brain disorders of different aetiologies 
XX 

SQ Sequence 2781 BP; 658 A; 678 C; 765 G; 680 T; 0 U; 0 Other; 

Query Match 95.7%; Score 1783; DB 6; Length 2781; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 1812; Conservative 0; Mismatches 25; Indels 4; Gaps 1; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 ACAGGGCAGAACAAT GAGTC CT GT TCAGGGT CAT CGGACT GCAAGGAGGGT GT CAT C C T G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 ACAGGGCAGAACAAT GAGT C CTGT T C AGGGT CAT CGGACT GCAAGGAGGGT GT CAT C CT G 180 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 TCT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT TAAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 T CT ATT GAAGTCAT CAC CT CT CAAGAGAGGGAGGT GACAATT AAGAAAC C CAAT GGAGAA 360 

Qy 361 AC C AG C ACAACC AC T ATT C GGGT CT GGAAT GAAACT GT CT CCAAC CT GAC C CT TAT GGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 

Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 54 0 

I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 4 81 ATT GC T GGT GAT CT GGGAC CTT CT AC CAT T GT AGGGAGT G CAGCCT T CAAC AT GTT CAT C 54 0 



541 AT CAT T GGCAT CT GT GT CT AC GT GAT C C C AGACG GAGAGACT CGCAAGAT CAAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 AT CAT T GGCAT CT GT GT C T AC GTGAT C C CAGACG GAGAGACT CGCAAGAT CAAGCAT CTA 600 

601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

601 C GAGT CT T CTT CAT C AC C GCT GCT T GGAGT AT CT T T G C CT ACAT CT GGCT CTAT AT GAT T 660 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 7 80 

7 81 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 840 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

781 AT GC ACAAAAAGTAC C GC AC AGACAAACAC C GAGGAAT TAT CAT AGAGAC AGAGGGT GAC 8 40 

841 CACCCTAAGGGCATT GAGATGGATGGGAAAAT GAT GAATTCCCATTTT CTAGAT GGGAAC 900 

I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
841 CACCCTAAGGGCATT GAGAT GGATGGGAAAAT GAT GAATTC CCATTTT CTAGAT GGGAAC 900 

901 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTCTC 960 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
901 CTGGTGCCCCT GGAAGGGAAG GAAGT GGAT GAGT C CC G CAGAGAGAT GAT C C GGATT CT C 960 

961 AAGGAT CT GAAGC AAAAACAC CCAGAGAAGGACT T AGATCAGCT GGT GGAGAT G GC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 AAGGAT CT GAAGCAAAAACAC CC AGAGAAG GACT T AGAT CAGCT GGT GGAGAT GGCCAAT 1020 

1021 TACT AT GCTCTTTCC C AC C AACAGAAGAGC C GC GC CT T CT AC C GT AT C C AAG C C ACT C GT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGTGCCTTCTACCGTATCCAAGCCACTCGT 108 0 

1081 AT GAT GACT GGT GC AGGCAAT AT C CT GAAGAAACAT G CAGCAGAACAAGC CAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 AT GAT GACT GGT G CAGGCAAT AT C CT GAAGAAAC ATGCAGCAGAACAAGC CAAGAAGG CC 114 0 

1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I II I I I I I I I I I I 
1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

1201 GACC CAT GTT CTTAC CAGT GCCT GGAGAACTGT GGGGCTGTACT CCTGACAGT GGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I 
12 01 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

1261 AAAGGG GGAGACAT GT CAAAGAC CAT GT AT GT GGACT ACAAAAC AGAGGAT GGT T CT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 AAAG GGGGAGACAT GT CAAAGAC C AT GT AT GT G GACT ACAAAAC AGAG GAT GGT T CT GCC 1320 

1321 AAT GC AG GGG CT GACT AT GAGTT C ACAGAG GGCACGGT GGT TCT GAAGC CAGGAGAGACC 1380 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1321 AAT GCAGGGGCTGACTAT GAGTT CACAGAGGGCACGGT GGTTCT GAAGCCAGGAGAGACC 1380 



Qy 

Db 



1381 
1381 



1440 
1440 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1441 T T T GTAAGGT T GAGCAAT GTC C GC AT AGAGGAGGAGC AGCC AGAG GAGGG GATGC CT C CA 1500 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
1441 T T T GTAAGGT T GAGCAAT GTC CGC AT AGAGGAGGAGCAGC CAGAGGAG GGGAT G C CT C CA 1500 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

1561 GT T AC CAT CT T GGAT GAT GAC CAT GCAG GCAT CT T C ACT T T T GAAT GT GAT ACT AT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1561 GTTACCAT CTTGGAT GAT GACCAT GCAGGCAT CTT CACTTTT GAATGT GATACT ATTCAT 1620 

162 1 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I 

162 1 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 ACAGT CAT CGT CCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGT GGCGGT GAGGACTTT 1740 

1741 GAAGACAC AT AT G GG GAGTT G GAATT CAAGAAT GAT GAAACT GT AT GT GACAGAC AGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

1741 GAAGACAC AT AT G G G G AGT T G GAAT T CAAGAAT GAT G AAAC T GT GAAAAC C AT AAG 17 96 

18 01 GCT GACTATGGAAGAAGAGGAGGC CAAGAGGAT AGCAGAGA 1841 

III I I I I I I I I I I I II I I I I I I I 

17 97 G GT T AAAAT AGT AGAT GAGGAGGAAT AC G AAAGG C AAGAGA 1837 



RESULT 9 
ABN83428 

ID ABN83428 standard; cDNA; 2782 BP. 
XX 
AC 
XX 
DT 
XX 
DE 
XX 
KW 
KW 
XX 
OS 
XX 
FH 
FT 
FT 
FT 
XX 
PN 
XX 
PD 
XX 



ABN83428; 

21-AUG-2002 (first entry) 

Human transporter protein coding sequence. 

Human; sodium/ calcium exchanger; transporter; brain; heart; kidney; lung; 
spleen; testis; leukocyte; foetal brain; chromosome 14; gene; ss. 



Homo sapiens. 

Key 
CDS 



WO200233086-A2. 
25-APR-2002. 



Location/Qualifiers 
10. .2775 
/*tag= a 

/product^ "Human transporter" 



PF 17-OCT-2001; 2001WO-US032152 . 
XX 

PR 17-OCT-2000; 2000US-024 0836P . 

PR 13-MAR-2001; 2001US-008 04474 . 
XX 

PA (PEKE ) PE CORP NY. 
XX 

PI Merkulov GV, Ketchum KA, Shao W, Yan C, Di Francesco V; 



PI Beasley EM; 
XX 

DR WPI; 2002-479677/51. 

DR P-PSDB; ABB83246. 
XX 

PT Human transporter peptide related to sodium/ calcium exchanger subfamily 

PT for identifying modulators useful for treating a disease or condition 

PT mediated by human transporter protein. 
XX 

PS Claim 4; Fig 1; 200pp; English. 



XX 

CC The present sequence is the coding sequence of a human transporter 

CC protein, which is related to the sodium/ calcium exchanger subfamily. 

CC Experimental data indicates expression of the transporter gene in humans 

CC in brain, heart, kidney, lung, spleen, testis, leukocyte and foetal 

CC brain. The gene of the transporter was mapped to chromosome 14 by ePCR 

XX 

SQ Sequence 2782 BP; 655 A; 685 C; 766 G; 676 T; 0 U; 0 Other; 

Query Match 95.7%; Score 1783; DB 6; Length 2782; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 1812; Conservative 0; Mismatches 25; Indels 4; Gaps 1; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 10 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 69 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 70 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 129 

Qy 121 ACAGGG CAGAACAAT GAGT C CT GTT CAGGGT CAT CGGACT GCAAGGAGGGT GT CAT C CT G 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 130 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGT CAT CGGACT GCAAGGAGGGT GTCAT CCT G 18 9 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGAC7VAGATTGCCAGGGTCATTGTCTAT 24 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 190 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 9 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 30 0 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 250 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 309 

Qy 301 T CT AT T GAAGT CAT C AC CT C T C AAGAG AGG GAG GT GAC AAT T AAGAAAC C C AAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 310 T CT AT T GAAGT CAT CAC CT CT CAAGAGAGGGAG GT GAC AAT T AAGAAAC C CAAT GGAGAA 369 



Qy 



361 AC CAGC ACAAC C ACT AT TCGGGTCTG GAAT GAAACT GT CT CCAAC CT GAC C CT TAT GGC C 420 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 



Db 370 ACCAGCACAACCACTATTCGGGTCTGG7\ATGAAACTGTCTCCAACCTGACCCTTATGGCC 429 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 430 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 489 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 54 0 

I I I I I I I I I I I I I I I I I I II I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 490 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 54 9 

Qy 541 AT CAT T GG CAT CT GT GT CTAC GT GAT C C CAGACGGAGAGACT C GCAAGAT CAAG C AT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 550 AT CAT T G GCAT CT GT GT CTAC GT GAT C C CAGACGGAGAGACT C GCAAGAT CAAGCATCT A 609 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 610 C GAGT CTT CTT CAT C AC C GCT GCT T GGAGT AT CT T T G C C TACAT C T GGCT CT AT AT GAT T 669 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 670 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 729 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACATVATAC 7 80 

I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I II I I II I I I 
Db 730 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 7 89 

Qy 781 AT GC ACAAAAAGTAC CG C AC AGACAAAC ACC GAGGAAT TAT CAT AGAGACAGAGGGT GAC 8 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 90 AT GC AC AAAAAGT AC C G C AC AGACAAAC AC C GAG GAAT TAT C AT AGAGACAGAG GGT GAC 849 

Qy 841 CACCCTAAGGGCATTGAGATGGAT GGGAAAAT GAT GAATTCCCATTTT CTAGATGGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II 

Db 850 CACCCTAAGGGCATTGAGATGGAT GGGAAAAT GAT GAATTCCCATTTT CTAGATGGGAAC 909 

Qy 901 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTCTC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 910 CTGGTGCCCCT GGAAGG GAAGGAAGT GGAT GAGT C CCG CAGAGAGAT GAT C C GGAT CCT C 969 

Qy 9 61 AAGGAT CT GAAGCAAAAACACC CAGAGAAGGACTTAGAT CAGCT GGT GGAGATGGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 97 0 AAGGAT CT GAAG CAAAAACAC C CAGAGAAGGACT T AGAT CAGCT GGT GGAGATGGC CAAT 1029 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1030 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1089 

Qy 1081 AT GAT GACT GGT GC AGGCAAT AT C CT GAAGAAAC AT GC AGC AGAACAAGCCAAGAAGGC C 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1090 AT GAT GACT GGT GC AGG CAAT AT CCT GAAGAAAC AT GC AGC AGAACAAG CCAAGAAGGC C 1149 

Qy 1141 T C CAGCAT GAGC GAGGT G CAC ACC GAT GAGC C T GAGGACTT T AT T T CCAAGGT CT T CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1150 T C CAGCAT GAGC GAGGT G CAC ACC GAT GAGC CT GAGGACTT TAT T T CCAAG GTCTTCTTT 1209 



Qy 12 01 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1210 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1269 



Qy 1261 AAAGGGG GAGAC AT GT CAAAGAC CAT GT AT GT GGACTAC AAAAC AGAG GAT GGT T CT G C C 132 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1270 AAAGGGG GAGACAT GT CAAAGAC C AT GT AT GT G GACT ACAAAAC AGAG GAT GGT T CT GCC 1329 

Qy 1321 AATGCAGGGGCT GACTAT GAGT T CACAGAGGGCACGGT GGTT CT GAAGC CAGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1330 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1389 

Qy 1381 CAGAAGGAGTT CTCCGT GGGCATAATT GAT GACGACATTTTTGAGGAGGAT GAACACTTC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1390 CAGAAGGAGT T CTCCGT GGGCATAATT GAT GACGACATTTTT GAGGAGGAT GAACACTTC 144 9 

Qy 1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 1450 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1509 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1510 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1569 

Qy 1561 GT T AC CAT CT T GGAT GAT GAC CAT GC AGGCAT C TT C ACT T T T GAAT GT GAT ACT AT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1570 GTTACCATCTT GGAT GAT GAC CAT GCAGGCATCTT CACTTTT GAATGT GATACTATTCAT 1629 

Qy 1621 GTC AGT GAGAGTATT GGT GT T AT GGAG GT CAAGGT TCT GCGGAC AT CAGGT GCC C GGG GT 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1630 GTC AGT GAGAGTATT GGT GT TAT GGAG GT CAAG GT T CT GCGGAC AT CAGGT GCC C GGG GT 1689 

Qy 1681 ACAGTC AT CGT CC CCTT T AGGACAGT AGAAGGGACAGC CAAGGGT GG C GGT GAGGACTT T 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1690 ACAGT CAT CGT CCC CTT T AGGACAGT AGAAGGGACAGC CAAGGGT GG C GGT GAGGACT TT 174 9 

Qy 1741 GAAGACACATATGGGGAGTTGGAATTCAAGAATGATGAAACTGTATGTGACAGACAGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1750 G AAG AC AC AT AT GGG GAGT T G GAAT T C AAG AAT GAT G AAAC T GT GAAAAC C AT AAG 1805 

Qy 1801 GCTGACTATGGAAGAAGAGGAGGCCAAGAGGATAGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 

Db 18 06 GGT T AAAATAGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGA 184 6 



RESULT 10 
ABZ33735 

ID ABZ33735 standard; cDNA; 2966 BP. 
XX 

AC ABZ33735; 
XX 

DT 30-JAN-2003 (first entry) 
XX 

DE Human TRICH encoding cDNA SEQ ID NO 41. 
XX 

KW Human; TRICH; transporter and ion channel; transport disorder; 

KW cystic fibrosis; diabetes mellitus; Parkinson's disease; cancer; 

KW neurological disorder; Alzheimer's disease; Huntington's disease; 

KW immunological disorder; AIDS; asthma; cell proliferative disorder; 

KW transgenic; gene therapy; neuroprotective; antidiabetic; cytostatic; 



KW antiparkinsonian; hypotensive; nootropic; antianaemic; anticonvulsant; 

KW cerebroprotective; cardiant; anti-HIV; human immunodeficiency virus; 

KW antiasthmatic; antiatherosclerotic; antigout; antiarteriosclerotic; 

KW hepatotropic; antiinflammatory; virucide; cytostatic; gene; ss. 
XX 

OS Homo sapiens . 
XX 

PN WO200246415-A2. 
XX 

PD 13-JUN-2002. 
XX 

PF 05-DEC-2001; 2001WO-US046963 . 
XX 

PR 08-DEC-2000; 

PR 15-DEC-2000; 

PR 21-DEC-2000; 

PR 12-JAN-2001; 

PR 19-JAN-2001; 

PR 26-JAN-2001; 

PR 02-FEB-2001; 
XX 

PA ( INCY- ) INCYTE GENOMICS INC. 
XX 

PI Lee EA, Baughn MR, Yue H, Ding L, Raumann BE, Hafalia AJA; 

PI Khan FA, Nguyen DB, Elliott VS, Ramkumar J, Walia NK, Ison CH; 

PI Lu Y, Gandhi AR, Warren BA, Duggan BM, Tribouley CM, Burford N; 

PI Lu DAM, Lai PG, Yao MG, Xu Y, Bruns CM, Thangavelu K, Swarnakar A; 

PI Tang YT, Azimzai Y, Thornton M, Arvizu C, Policky JL; 

XX 

DR WPI; 2002-519667/55. 

DR P-PSDB; ABP74104. 
XX 

PT Novel human transporter and ion channel polypeptide, useful in diagnosis, 

PT prevention or treatment of transport, neurological, muscle, immunological 

PT and cell proliferative disorders. 
XX 

PS Claim 96; SEQ ID NO 41; 146pp + Sequence Listing; English. 
XX 

CC The invention relates to human transporter and ion channel polypeptide 

CC (TRICH) (I) selected from one of 32 polypeptide sequences (ABP74096- 

CC ABP74127), a naturally occurring polypeptide comprising a sequence having 

CC at least sequence 90 % identity to (I) or a biologically active or 

CC immunogenic fragment of (I). (I) is useful for screening a compound for 

CC effectiveness as an agonist or antagonist, for screening a compound that 

CC specifically binds (I) or modulates the activity of (I) and for preparing 

CC a polyclonal or monoclonal antibody by hybridoma technology. 

CC Polynucleotides (II, ABZ33727-ABZ33758 ) encoding (I) are useful for 

CC screening a compound altering gene expression. (I) and (II) are useful in 

CC a diagnostic tests for a condition or a disease associated with the 

CC expression of TRICH in a biological sample, especially disorders selected 

CC from a transport disorder such as cystic fibrosis, diabetes mellitus, 

CC Parkinson's disease, cardiac disorders, neurological disorders such as 

CC Alzheimer's disease, Huntington's disease, muscle disorders, 

CC immunological disorder such as AIDS, asthma and atherosclerosis, and cell 

CC proliferative disorder such as arteriosclerosis, cirrhosis, hepatitis and 

CC cancer. (II) is useful for creating knock-in humanised animals or 

CC transgenic animals to model human diseases, in somatic or germline gene 
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CC therapy, to generate a transcript image of a tissue or cell type, for 

CC detecting differences in the chromosomal location due to translocation, 

CC inversion among normal, carrier or affected individuals and for mapping 

CC genomic sequences. Note: The sequence data for this patent is not 

CC represented in the printed specification but is based on sequence 

CC information supplied to Derwent by the European Patent Office 

XX 

SQ Sequence 2966 BP; 692 A; 725 C; 809 G; 740 T; 0 U; 0 Other; 

Query Match 95.7%; Score 1783; DB 6; Length 2966; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 1812; Conservative 0; Mismatches 25; Indels 4; Gaps 1; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 201 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 260 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

1 1 1 1 1 1 I 1 1 I I i I 1 1 1 1 I I I I I 1 1 1 1 I I I I 1 1 i I I I 1 1 1 I I I 1 1 1 1 1 I I I 1 1 I 1 1 I 1 1 I I 

Db 261 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 320 

Qy 121 AC AGG G C AGAACAAT GAGT C CT GT T C AGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 321 AC AGGGCAGAACAAT GAGT C CT GT TC AGGGT CAT CG GACT GCAAGGAGGGT GT CAT C CT G 380 

Qy 181 C CAAT CT GGT AC C CGGAGAACCCT T C C CTT GGGGACAAGATT GC CAGGGT CAT T GT CTAT 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
Db 381 CCAATCTGGTACCCGGAGJ^ACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 440 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 441 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 500 

Qy 301 T CT ATT GAAGT CATCACCT CT CAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 360 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I 

Db 501 T CTAT T GAAGT CAT C AC CT C T C AAG AGAG G GAG GT G AC AAT T AAG AAAC C CAAT GGAGAA 560 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 561 ACCAGCACAACCACTATTCGGGT CTGGAAT GAAACT GTCT CCAACCT GACCCT TAT GGCC 620 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 621 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 68 0 

Qy 481 ATTGCT GGT GAT CTGGGACCTT CT ACCATT GTAGGGAGT GCAGCCTT CAACAT GTT CAT C 54 0 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 681 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 740 

Qy 541 AT CAT T GGC AT CT GT GT CT AC GT GAT C C C AGAC GGAGAGACT C G CAAGAT CAAGC AT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 741 AT CATT GGCATCT GT GTCTACGTGAT CCCAGACGGAGAGACT CGCAAGAT CAAGCAT CT A 800 



Qy 

Db 



601 
801 



660 
860 



Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 861 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 920 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTAC7^AATAC 7 80 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 921 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 980 

Qy 781 AT G C AC AAAAAGT AC C GC AC AGACAAAC AC C GAGGAAT TAT C AT AGAGAC AGAG GGT GAC 84 0 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 981 AT GCACAAAAAGT AC CG CAC AGACAAAC AC C GAGGAAT TAT C ATAGAGACAGAGGGT GAC 1040 

Qy 841 CAC C CT AAGG GC AT T GAG AT GGAT G GGAAAAT GAT GAAT T C C CAT T T T C T AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1041 CACCCTAAGGGCATT GAGATGGATGGGAAAAT GAT GAATTC CCATTTT CTAGATGGGAAC 1100 

Qy 901 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTCTC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I 

Db 1101 CT GGT GCCCCT GGAAGGGAAGGAAGT GGATGAGT CCCGCAGAGAGATGATCCGGATTCT C 1160 

Qy 961 AAGGAT CT GAAG CAAAAACAC C CAGAGAAGGACTT AGAT CAGCT GGT G GAGAT GGCCAAT 1020 

I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1161 AAGGAT CT GAAG CAAAAACAC C CAGAGAAGGACT T AGAT CAGCT GGT GGAGAT G G C CAAT 1220 

Qy 1021 TACTATGCTCTTTCCCACC7UVCAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1221 TACTATGCTCTTTCCCACCAACAGAAGAGCCGTGCCTTCTACCGTATCCAAGCCACTCGT 1280 

Qy 1081 AT GAT GACT GGTGCAGGCAAT AT C CT GAAGAAACAT GC AGC AGAACAAG CCAAGAAGG C C 1140 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I 

Db 12 81 AT GAT GACT GGT GC AGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGCCAAGAAG GC C 1340 

Qy 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1341 T C CAGCAT GAG C GAG GT G CACAC C GAT GAGC CT GAGGACTT TAT TT CCAAGGT CT T CT T T 1400 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 12 60 

I II I I I I I I I I I I I II I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1401 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 14 60 

Qy 12 61 AAAG GGGGAGACAT GT CAAAGACC ATGT ATGT GGACT ACAAAAC AGAG GAT GGTTCTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1461 AAAGGGGGAGACAT GT CAAAGAC C AT GT AT GT GGACT AC AAAACAGAGGAT GGT T CT GC C 1520 

Qy 1321 AAT GCAGGGGCT GACT AT GAGTT CACAGAGGGCACGGT GGTTCT GAAGC CAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1521 AAT GCAGGGG CT GACT AT GAGT T CACAGAGGG CAC GGT GGT T CT GAAGCCAGGAGAGAC C 1580 

Qy 1381 C AG AAG GAG TTCTCCGTGGG CAT AAT T GAT GAC GAC AT T T T T GAG GAG GAT G AAC AC T T C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1581 CAGAAGGAGTT CT CCGT GGGCATAATT GATGACGACATTTTTGAGGAGGAT GAACACTTC 1640 

Qy 14 41 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I II I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1641 TTT GTAAGGTT GAGCAAT GT C CGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCT CCA 17 00 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 



Db 1701 

Qy 1561 

Db 1761 

Qy 1621 

Db 1821 

Qy 1681 

Db 1881 

Qy 1741 

Db 1941 

Qy 1801 

Db 1997 

RESULT 11 
ABN83429 

ID ABN83429 
XX 

AC ABN83429 
XX 

DT 21-AUG-2002 (first entry) 
XX 

DE Human transporter protein gene. 
XX 



KW Human; sodium/ calcium exchanger; transporter; brain; heart; kidney; lung; 

KW spleen; testis; leukocyte; foetal brain; chromosome 14; gene; 

KW single nucleotide polymorphism; SNP; ds . 
XX 

OS Homo sapiens . 
XX 

FH Key Location/Qualifiers 

FT variation replace ( 378 , T ) 

FT /*tag= a 

FT /standard__name= "Single nucleotide polymorphism" 

FT variation replace (741. .742,0-) 

FT /*tag= b 

FT /standard__name= "Single nucleotide polymorphism" 

FT /note= "This variation is an indel" 

FT variation replace (2002, T) 

FT /*tag= c 

FT /standard_name= "Single nucleotide polymorphism" 

FT CDS 2010. .124505 

FT /*tag= d 

FT /product= "Human transporter" 

FT /note= "Contains 5 introns" 

FT exon 2010. .3793 

FT /*tag= e 



I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I 

GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1760 

GTTACCAT CTT GGAT GAT GAC CAT GCAGGCAT CTT CACT TTTGAATGT GATACTATTCAT 1620 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTTACCAT CTT GGAT GAT GAC CAT GCAGGCATCTT CACTTTT GAATGT GATACTATTCAT 1820 

GT CAGT GAGAGT AT T GGT GT TAT G GAGGT CAAG GT T CT GC G GAC AT C AG GT GCCCGGGGT 1680 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I 
GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1880 

ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 174 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
ACAGT CAT CGT C CC C TT T AG GACAGTAGAAGGGACAGC CAAG GGT GGC GGT GAGGACT T T 194 0 

GAAGACACATAT GG GGAGT T GGAATT CAAGAAT GAT GAAAC T GT AT GT GACAGAC AGGAA 1800 
I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

GAAGACACATAT GG G GAGT T GGAATT CAAGAAT GAT GAAAC T GT GAAAAC C AT AAG 1996 

GCT GAC TAT GGAAGAAGAGGAGGCCAAGAGGAT AGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 

GGTTAAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGA 2037 



standard; DNA; 126512 BP. 



FT /number^ 1 

FT variation replace (2381, C) 

FT /*tag= f 

FT /standard_name= "Single nucleotide polymorphism" 

FT intron 3794. .109509 

FT /*tag= g 

FT / number = 1 

FT variation replace ( 5165, T) 

FT /*tag= h 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 5402 , G) 

FT /*tag= i 

FT /standard__name= "Single nucleotide polymorphism" 

FT variation replace ( 6794 , C) 

FT /*tag= j 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 9883, G) 

FT /*tag= k 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 10210, C) 

FT /*tag= 1 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 12220, G) 

FT /*tag= m 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 13842 , G) 

FT /*tag= n 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 14200, A) 

FT /*tag= o 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 15878, T) 

FT /*tag= p 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 16030, G) 

FT /*tag= q 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 16292 , C) 

FT /*tag= r 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 16506, G) 

FT /*tag= s 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 17953, A) 

FT /*tag= t 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (23832, G) 

FT /*tag= u 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 25001, A) 

FT /*tag= v 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (25141, G) 

FT /*tag= w 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 25191, G) 

FT /*tag== x 



"Single nucleotide polymorphism" 
'Single nucleotide polymorphism" 



FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (26147 , A) 

FT /*tag= y 

FT /standard_name= 

FT variation replace (274 00, G) 

FT /*tag= z 

FT /standard_name= 

FT variation replace (27401, T) 

FT /*tag= aa 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (29278, C) 

FT /*tag= ab 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (31437, G) 

FT /*tag= ac 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 31857 , G) 

FT /*tag= ad 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 33155, A) 

FT /*tag= ae 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 394 87 , C) 

FT /*tag= af 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (41449, C) 

FT /*tag= ag 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (42420, C) 

FT /*tag= ah 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (43256, C) 

FT /*tag= ai 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 43967 , C) 

FT /*tag= aj 

FT /standard__name= "Single nucleotide polymorphism" 

FT variation replace ( 48603 . . 48604, A-) 

FT /*tag= ak 

FT /standard_name= "Single nucleotide polymorphism" 

FT /note= "This variation is an indel" 

FT variation replace (49560, T) 

FT /*tag= al 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (52729, G) 

FT /*tag= am 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 55031 , G) 

FT /*tag= an 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (55066, C) 

FT /*tag= ao 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (56912, G) 

FT /*tag= ap 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (58480, T) 



FT /*tag= aq 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (61128, A) 

FT /*tag= ar 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (61320, A) 

FT /*tag= as 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 61444, C) 

FT /*tag= at 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 6264 1, C) 

FT /*tag= au 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 63023, G) 

FT /*tag= av 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 63051, C) 

FT /*tag= aw 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 64989, G) 

FT /*tag= ax 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 65929, A) 

FT /*tag= ay 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 66694 , G) 

FT /*tag= az 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 66755, A) 

FT /*tag= ba 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 66879, C) 

FT /*tag= bb 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 69156, T) 

FT /*tag= be 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (69280, T) 

FT /*tag= bd 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (70647 , T ) 

FT /*tag= be 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 7 1867 , T) 

FT /*tag= bf 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (71900, T) 

FT /*tag= bg 

FT /standard__name= "Single nucleotide polymorphism" 

FT variation replace (71901, A) 

FT /*tag= bh 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (72369, T) 

FT /*tag= bi 



Query Match 



95.7%; Score 1782.8; DB 6; Length 126512; 



Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1784; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 010 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 2069 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 2070 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 2129 

Qy 121 ACAGGGCAGAACAATGAGT C CT GT T C AGGGT C AT CGGACT GCAAGGAGGGTGT CAT C CT G 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2130 AC AGGG CAGAACAAT GAGT C CT GT TC AGGGT CAT C G GACT GCAAGGAGGGT GT CAT C CT G 2189 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2190 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 2249 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 2250 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 2309 

Qy 301 T C TAT T G AAGT CAT C AC C T C T C AAG AG AG G G AG GT G AC AAT T AAG AAAC C C AAT G G AG AA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2310 T C TAT T G AAGT CAT C AC C T C T C AAG AG AG G G AG GT G AC AAT T AAG AAAC C C AAT G GAG AA 2369 

Qy 361 AC CAGCACAACCACTATTCGGGT CTGGAATGAAACTGTCT CCAACCT GACCCTTAT GGCC 42 0 

I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2370 ACCAGCACAACAACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 2429 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 48 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2430 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 2489 

Qy 481 ATT GCT GGTGATCTGGGACCTTCTACCATT GTAGGGAGTGCAGCCTT CAACAT GTTCATC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2490 AT T GCT GGT GAT CT GG GAC CT T CTAC C ATT GTAGGGAGT GCAGC CT T CAACAT GTT C AT C 254 9 

Qy 541 AT CAT T G G CAT C T GT GT C T AC GT GAT C C C AG AC G GAG AG AC T C G C AAG AT C AAG CAT C T A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2550 AT C ATT G GC AT CT GT GT CT ACGT GAT C CCAGAC GGAGAGACT CGCAAGAT CAAGCAT C T A 2609 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2610 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 2669 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 72 0 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 2670 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 2729 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 78 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2 730 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGAT7WVCGACTGCTCTTCTACAAATAC 27 89 

Qy 781 AT GC ACAAAAAGT AC C GCAC AGACAAACAC C GAGGAATT AT CAT AGAGAC AGAGGGT GAC 84 0 

I I i 1 1 1 1 1 1 1 I 1 1 1 1 1 i I I I I I 1 1 I 1 1 I 1 1 I I I 1 1 1 1 1 I I I 1 1 1 1 1 1 1 1 1 1 I I I 1 1 1 I I I 



Db 2790 AT GCAC AAAAAGT AC C GC ACAGACAAAC ACC GAGGAAT TAT C AT AGAGAC AGAGG GT GAC 2 849 

Qy 841 C AC C CTAAGGGCATT GAGAT GGAT G GGAAAAT GAT GAAT T C C CAT T TT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I II I I I I M I I I I I I I I I I I I 

Db 2850 C ACC C T AAG GGCATT GAGAT GGAT G GGAAAAT GAT GAAT T C C CAT T TT CT AGAT GGGAAC 2 909 

Qy 901 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTCTC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2910 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTCTC 2969 

Qy 961 AAGGAT CT GAAGCAAAAACAC C C AGAGAAGGACTT AGAT CAGCT G GT GGAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 297 0 AAGGATCT GAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCT GGTGGAGATGGCCAAT 3029 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 

Db 3030 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 3089 

Qy 1081 AT GAT GACT GGT GCAGGCAATAT C CT GAAGAAAC AT GC AGCAGAACAAG C CAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3090 AT GAT GACT GGT GCAGGCAATATCCT GAAGAAAC AT GCAGCAGAACAAGCCAAGAAGGCC 3149 

Qy 1141 T CCAGCAT GAG C GAGGT GCACAC C GAT GAGC CT GAGGACTT T AT T T CCAAG GT CT T CTT T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3150 T C CAGCAT GAG C GAGGT GCACACC GAT GAGC CT GAGGACTT TAT T T CCAAG GT CTT CT T T 3209 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 3210 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 3269 

Qy 12 61 AAAGGGG GAGACAT GT CAAAGACCAT GT ATGT GGACT ACAAAAC AGAG GAT GGTT CT G C C 1320 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 327 0 AAAGG G GGAGAC AT GT CAAAGAC CATGT AT GT GGACT ACAAAAC AGAGGAT GGTT CT GC C 3329 

Qy 1321 AAT GCAGGGGCT GACTAT GAGT T C ACAGAGGGCAC GGT GGT T CT GAAGC CAG GAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3330 AAT GCAGGGGCT GACTAT GAGT T C ACAGAGGGCAC GGT GGT T CT GAAGC CAGGAGAGAC C 3389 

Qy 1381 CAGAAGGAGTTCTCCGTGGGCATAATTGATGACGACATTTTTGAGGAGGATGAACACTTC 1440 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3390 CAGAAGGAGTT CTCCGT GGGCATAATT GATGACGACATTTTT GAGGAGGAT GAACACTT C 3449 

Qy 1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3450 T TT GT AAGGT T GAG CAAT GT C C GCAT AGAGGAGGAGCAGC C AGAGGAGGGGAT G C CT C CA 3509 

Qy 1501 GCAATATTCT^ACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I 
Db 3510 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 3569 

Qy 1561 GT T AC CAT CTT GGAT GAT GAC CAT G CAG GCAT CTT C ACT T T T GAAT GT GAT ACT AT T CAT 1620 

I I I I I I I I I I I II I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3570 GTTACCAT CTT GGAT GAT GAC CAT GCAGGCATCTTCACTTTTGAATGT GATACTATT CAT 3629 



Qy 

Db 



1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3630 GT CAGT GAGAGT AT T GGT GT TAT G GAGGT CAAGGT T CT GC GGACAT CAGGT GC C C GG G GT 3689 



Qy 1681 ACAGT CAT C GT C C C CTT T AG GACAGT AGAAGGGACAG C CAAGGGT GGC GGT GAGGACT TT 174 0 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 3690 ACAGT CAT CGT C CC CTT T AG GACAGT AGAAGGGACAGC CAAGG GT GG C GGT GAGGACTTT 3749 

Qy 1741 GAAGACACATAT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GT AT 1786 

II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3750 GAAGACACATAT G G GGAGTT G GAATT CAAGAAT GAT GAAACT GT GT 3795 
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PI Mazur A; 
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DR WPI; 2003-046862/04. 

DR P-PSDB; ABU12041. 
XX 

PT New isolated NOVX polypeptide useful for treating cardiomyopathy, 

PT atherosclerosis, metabolic disorders, diabetes, obesity, infectious 

PT disease, anorexia, neurodegenerative disorders, Alzheimer's disease and 

PT cancer. 

XX 

PS Claim 3; Page 83-84; 425pp; English. 
XX 

CC This invention describes novel polypeptides, termed NOVX which have 

CC antidiabetic, antiarteriosclerotic, anorectic, metabolic, antimicrobial, 

CC neuroprotective, antiparkinsonian, antilipaemic, cytostatic, nootropic, 

CC cardiant and immunomodulatory activity. The polypeptide and any 

CC antibodies generated from it are useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease 

CC selected from a pathology associated with the NOVX polypeptide. Fragments 

CC and portions of the polynucleotides encoding NOVX polypeptides are useful 

CC to map the location of NOVX genes on a chromosome, to identify 

CC individuals from minute biological samples, as DNA markers for 

CC restriction fragment length polymorphism (RFLP) , and are useful to 

CC prepare polymerase chain reaction primers . The products of the invention 

CC can be used in gene therapy and for treating cardiomyopathy, metabolic 

CC disorders, diabetes, atherosclerosis, obesity, infectious disease, 

CC anorexia, neurodegenerative disorders, Alzheimer's disease, Parkinson's 

CC disease, immune disorders, haematopoietic disorders, and various 

CC dyslipidaemias, metabolic disturbances associated with obesity, metabolic 

CC syndrome X and wasting disorders associated with chronic diseases and 

CC various cancers. ABX5 6261-ABX56306 represent the polynucleotide fragments 

CC which encode the NOVX polypeptides represented in ABU12041-ABU12086 

XX 

SQ Sequence 2813 BP; 617 A; 716 C; 813 G; 667 T; 0 U; 0 Other; 

Query Match 95.7%; Score 1782.4; DB 7; Length 2813; 
Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1783; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 9 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 68 



Qy 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



69 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 128 

121 ACAGGG C AGAACAAT GAGT C CT GT T C AGGGT C AT CGGACT GCAAGGAGG GT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
129 ACAGGGCAGAACAAT GAGT C CT GT T C AGG GT CAT C GGACT GCAAGGAGGGT GT CAT C C T G 18 8 

181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
189 CCAAT CT GGT ACC C GGAGAAC C CT T C C CTT GGGGACAAGAT T GC CAGGGT CAT T GT CT AT 24 8 

241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I 
249 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 308 

301 TCTATTGAAGTCATCACCTCTCAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

309 T CT AT T GAAGT CAT C AC CT CT CAAGAGAGG GAG GT GAC AAT T AAGAAAC C C AAT GGAGAA 368 

361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I 

369 AC C AGCACAAC CAC TAT TCGGGTCTG GAAT GAAACT GT CT C CAAC CT GAC C CTT AT GGCC 428 

421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

429 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 488 

4 81 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 89 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 548 

541 ATCATTGGCATCTGTGTCTACGTGATCCCAGACGGAGAGACTCGCAAGATCAAGCATCTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

549 AT C ATT GGCAT CT GT GT CTAC GT GAT C C CAGAC G GAGAGACT C GCAAGAT CAAGC AT CT A 608 

601 C GAGT CT T CT T CAT CAC C GCT GCT T GGAGT AT CTT T GC CT ACAT CT GGCT CTAT AT GAT T 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I 
609 C GAGT CT T CT T CAT CAC C GCT GCT T GGAGT AT CT TT GC CT ACAT CT G GCT CTAT AT GAT T 668 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
669 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 728 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 7 80 

M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 
729 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 7 88 

7 81 AT GCACAAAAAGTAC C G CACAGACAAACAC C GAGGAAT TAT CAT AGAGACAGAGGGT GAC 840 
M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I 

7 89 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 8 48 

841 CAC C CT AAGGG CAT T GAGAT G GAT GGGAAAAT GAT GAATT C C CAT T TT CTAGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

8 49 CAC C CT AAGGG CAT T GAGAT G GAT GGGAAAAT GAT GAAT T C C CAT T T T CTAGAT GGGAAC 908 

901 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTCTC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

909 CTGGTGCCCCT GGAAGGGAAGGAAGTG GAT GAGT C CC GCAGAGAGAT GAT C C GGAT T CT C 968 



Qy 961 AAGGAT C T GAAGCAAAAAC AC C CAGAGAAGGACT T AGAT CAGCT GGT G GAGAT GG C CAAT 1020 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 969 AAGGAT CT GAAGCAAAAAC AC C CAGAGAAGGACT TAGAT CAGCT G GT GGAGAT GGC CAAT 1028 

Qy 1021 TACT AT GCTCTTTCC CAC C AAC AG AAGAG CCGCGCCTT CT AC C GT AT C C AAGC CACT C GT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 102 9 TACTATGCTCTTTCCCACCAACAGAAGAGCCGTGCCTTCTACCGTATCCAAGCCACTCGT 1088 

Qy 1081 AT GATGACT GGT GCAGGCAATAT CCT GAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 114 0 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 108 9 AT GAT GACT GGT GCAGG CAAT AT C CT GAAGAAAC AT GCAGC AGAACAAGC CAAGAAGG C C 1148 

Qy 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 114 9 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1208 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I M 

Db 1209 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 12 68 

Qy 1261 AAAGGGGGAGACAT GT CAAAGACCATGTATGT GGACT ACAAAACAGAGGAT GGTT CT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 12 69 AAAG GGGGAGAC AT GT CAAAGACCAT GT AT GT GGACTACAAAAC AGAGGAT GGTT CT GC C 1328 

Qy 1321 AATGCAGGGGCT GACTAT GAGTTCACAGAGGGCACGGT GGTT CTGAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1329 AATGCAGGGGCT GACTATGAGTTCACAGAGGGCAC GGT GGTT CTGAAGCCAGGAGAGAC C 1388 

Qy 1381 CAGAAGGAGTTCTCCGTGGGCATAATTGATGACGACATTTTTGAGGAGGATGAACACTTC 1440 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I 

Db 138 9 CAGAAGGAGTTCTCCGTGGGCATAATTGATGACGACATTTTTGAGGAGGATGAACACTTC 1448 

Qy 1441 T T T GTAAG GTT GAGCAAT GT C C GCATAGAGGAGGAGCAGCCAGAGGAGGGGAT GC CT C CA 1500 

II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 144 9 T T T GTAAG GTT GAGCAAT GT C C GCATAGAGGAGGAGCAGCC AGAGGAGGGGAT GC CT CCA 1508 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1509 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 15 68 

Qy 1561 GTTACCATCTT GGAT GAT GACCATGCAGGCAT CTT CACTTTT GAATGT GATACTATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1569 GTTACCAT CTT GGAT GAT GACCATGCAGGCAT CTT CACTTTT GAAT GT GATACTATT CAT 1628 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 162 9 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1688 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I 
Db 168 9 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1748 

Qy 1741 GAAGACACAT AT GGGGAGT T GGAAT T CAAGAAT GAT GAAACT GT 1784 

I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1749 GAAGACACAT AT GGGGAGT T GGAAT T CAAGAAT GAT GAAACT GT 1792 



RESULT 13 
ABX56262 

ID ABX56262 standard; DNA; 2840 BP. 
XX 

AC ABX56262; 
XX 

DT 19-FEB-2003 (first entry) 
XX 

DE Human NOVlb CG56558-02 DNA SEQ ID 3. 
XX 

KW NOVX; human; antidiabetic; antiarteriosclerotic; anorectic; nootropic; 

KW metabolic; antimicrobial; neuroprotective; antiparkinsonian; cardiant; 

KW antilipaemic; cytostatic; immunomodulatory; gene therapy; dyslipidaemia; 

KW cardiomyopathy; metabolic disorder; diabetes; atherosclerosis; obesity; 

KW anorexia; neurodegenerative disorder; Alzheimer's disease; cancer; gene; 

KW Parkinson's disease; haematopoietic disorder; metabolic disturbance; 

KW metabolic syndrome X; wasting disease; ds . 
XX 

OS Homo sapiens. 
XX 

PN WO200281625-A2. 
XX 

PD 17-OCT-2002. 
XX 

PF 03-APR-2002; 
XX 

PR 03-APR-2 001; 

PR 05-APR-2001; 

PR 06-APR-2001; 

PR 10-APR-2001; 

PR 12-APR-2001; 

PR 12-APR-2001; 

PR 13-APR-2001; 

PR 13-APR-2 001; 

PR 13-APR-2 001; 

PR 17-APR-2001; 

PR 19-APR-2001; 

PR 20-APR-2001; 

PR 24-APR-2001; 

PR 25-APR-2 001; 

PR 07-JUN-2001; 

PR 26-JUN-2001; 

PR 08-AUG-2001; 

PR 13-AUG-2001; 

PR 16-AUG-2 001; 

PR 14-SEP-2001; 

PR 05-OCT-2001; 

PR 31-DEC-2001; 

PR 03-JAN-2002; 

PR 04-FEB-2002; 

PR 02-APR-2002; 
XX 

PA (CURA-) CURAGEN CORP. 
XX 

PI Padigaru M, Shenoy SG, Kekuda R, Rastelli L, Mezes PD; 

PI Smithson G, Guo X, Gerlach V, Casman SJ, Boldog FL, Li L; 



2002WO-US010366. 

2001US-0281086P. 
2001US-0281906P. 
2001US-0282020P. 
2001US-0282930P. 
2001US-0283444P. 
2001US-0283512P. 
2001US-0283657P. 
2001US-0283678P. 
2001US-0283710P. 
2001US-0284234P. 
2001US-0285325P. 
2001US-0285381P. 
2001US-0286068P. 
2001US-0286292P. 
2001US-0296692P. 
2001US-0300883P. 
2001US-0311003P. 
2001US-0311973P. 
2001US-0312901P. 
2001US-0322283P. 
2001US-0327448P. 
2001US-0345734P. 
2002US-0345755P. 
2002US-0354391P. 
2002US-00114153. 



PI Zerhusen BD, Tchernev VT, Gangolli EA, Vernet CAM, Spytek KA; 

PI Malyankar UM, Patturajan M, Miller CE, Taupier RJ, Heyes MP, Ju J; 

PI Peyman JA, Catterton E, Macdougall JR, Edinger SR, Stone DJ; 

PI Mazur A; 

XX 

DR WPI; 2003-046862/04. 

DR P-PSDB; ABU12042. 
XX 

PT New isolated NOVX polypeptide useful for treating cardiomyopathy, 

PT atherosclerosis, metabolic disorders, diabetes, obesity, infectious 

PT disease, anorexia, neurodegenerative disorders, Alzheimer's disease and 

PT cancer. 

XX 

PS Claim 3; Page 84; 425pp; English. 
XX 

CC This invention describes novel polypeptides, termed NOVX which have 

CC antidiabetic, antiarteriosclerotic, anorectic, metabolic, antimicrobial, 

CC neuroprotective, antiparkinsonian, antilipaemic, cytostatic, nootropic, 

CC cardiant and immunomodulatory activity. The polypeptide and any 

CC antibodies generated from it are useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease 

CC selected from a pathology associated with the NOVX polypeptide. Fragments 

CC and portions of the polynucleotides encoding NOVX polypeptides are useful 

CC to map the location of NOVX genes on a chromosome, to identify 

CC individuals from minute biological samples, as DNA markers for 

CC restriction fragment length polymorphism (RFLP) , and are useful to 

CC prepare polymerase chain reaction primers. The products of the invention 

CC can be used in gene therapy and for treating cardiomyopathy, metabolic 

CC disorders, diabetes, atherosclerosis, obesity, infectious disease, 

CC anorexia, neurodegenerative disorders, Alzheimer's disease, Parkinson's 

CC disease, immune disorders, haematopoietic disorders, and various 

CC dyslipidaemias, metabolic disturbances associated with obesity, metabolic 

CC syndrome X and wasting disorders associated with chronic diseases and 

CC various cancers. ABX56261-ABX56306 represent the polynucleotide fragments 

CC which encode the NOVX polypeptides represented in ABU12 041-ABU1208 6 

XX 

SQ Sequence 2840 BP; 668 A; 700 C; 775 G; 697 T; 0 U; 0 Other; 



Query Match 95.7%; Score 1782.4; DB 7; Length 2840; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1783; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 63 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 122 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 123 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 182 

Qy 121 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGTCAT CGGACT GCAAGGAGGGT GT CAT CCT G 180 

I I I I I I II II I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 183 ACAGGGCAGAACAAT GAGT C CT GTT CAGGGT CAT C G GACT GCAAGGAG GGT GT CAT C CT G 242 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 243 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 302 



Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 303 T T T GT GG C CCT GAT AT ACAT GTTCCTTGGGGTGTC CAT CAT T GCT GAC C GCT TCAT GGC A 362 

Qy 301 T CT AT T G AAGT CAT C ACCT CT CAAGAGAG GGAGGT GAC AAT T AAGAAAC CC AAT G GAGAA 360 

I I M I I I I I I I I II I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 363 T CT AT T GAAGT CAT CAC CT CT CAAGAGAGG GAGGT GAC AAT T AAGAAAC CCAAT GGAGAA 422 

Qy 361 AC CAG CACAAC CACT ATT C GG GT CT GGAAT GAAACT GT CT CCAAC CT GACC CTTAT GGC C 420 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 423 AC CAGCACAAC CACT AT T C GGGT CT GGAAT GAAAC T GT CT C CAAC CT GAC C CTTAT GGC C 482 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 483 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 542 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 543 AT T GCT GGT GAT CT G GGACCT T CT ACC AT T GT AGGGAGT GC AGC CTT CAACAT GT T CAT C 602 

Qy 541 AT CAT T GGCAT CTGT GT CT AC GT GAT C C CAGACG GAGAGACT CGCAAGAT CAAGC AT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 603 AT CAT T GGCAT CT GT GT CT AC GTGAT CC CAGACGGAGAGACT CGCAAGAT CAAGC AT CT A 662 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 663 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 722 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 723 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 782 

Qy 721 T TT C C AGT GT GT GT CCT T CT G GC CT GGGT G GCAGATAAAC GACT GCT CTT CT ACAAAT AC 780 

I | | | | I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 83 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 842 

Qy 7 81 AT GC ACAAAAAGTAC C G C AC AGACAAAC AC C GAG GAATT AT CAT AGAGACAGAG GGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 843 AT GCACAAAAAGT ACC GCAC AGACAAAC AC C GAGGAAT TAT CAT AGAGAC AGAGGGT GAC 902 

Qy 841 CACC CTAAGGGCATTGAGAT GGAT GGGAAAATGAT GAATT CCCATTTT CTAGATGGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 903 CAC C CT AAGGGCAT T GAGAT G GAT GG GAAAAT GAT GAATT C CCAT TT T CT AGAT GGGAAC 962 

Qy 901 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTCTC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I II I I I I I I I 
Db 963 CTGGTGCCCCTGGAAGGGAAGGAAGTGGAT GAGT CCCGCAGAGAGAT GAT CCGGATT CTC 1022 

Qy 961 AAGGAT CT GAAGCAAAAACACC CAGAGAAGGACTTAGAT CAGCT GGT GGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1023 AAG GAT CT GAAGCAAAAACAC CC AGAGAAGGACT T AGAT CAGCT GGT GGAGAT GG C CAAT 1082 

Qy 1021 TACT AT GCTCTTTCC C ACCAACAGAAGAGC CGCGCCTT CT AC C GT AT C CAAGC CACT C GT 1080 

I M I I I I I I I I M I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1083 TACTATGCTCTTTCCCACCAACAGAAGAGCCGTGCCTTCTACCGTATCCAAGCCACTCGT 1142 



Ov 


1081 


AT GAT GACT GGT GC AGGCAATAT CCT GAAGAAACAT GC AGCAGAACAAGCCAAGAAGGCC 


1140 




I | | | I 1 II I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 II 1 




Db 


1143 


AT GAT GACT GGT GCAGGCAAT ATCCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 


1202 


Ov 


1141 


T C C AG CAT GAG C GAG GT G C AC AC C GAT GAG CCT GAG G AC T T TAT T T C C AAG GTCTTCTTT 


1200 




I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1203 


T C C AGCAT GAGC GAG GT GCAC AC CGAT GAGC CT GAGGAC TT T ATT T C CAAG GT CT T CT T T 


1262 


Qy 


1201 


GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 


1260 




1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1263 


GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 


1322 


Ov 


1261 


AAAGGGGGAGACAT GT C AAAG AC CAT GT AT GT GGACT ACAAAACAGAGGAT GGTT CT GC C 


1320 


Db 


1323 


I | | | | | | | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 

AAAGGGGGAGACAT GT CAAAGACCAT GT AT GT GGACT ACAAAACAGAGGAT GGTT CT GC C 


1382 


Ov 


1 "3?1 

1 J 4. -L 


AAT G CAGGGGCT GACTAT GAGTT CACAGAGG GC AC GGT GGT T CT GAAGC CAG GAGAG AC C 


1380 




1 1 1 1 1 It 1 II 1 1 1 1 ! 1 1 1 1 1 II 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1383 


AAT GCAG GGGCT GACTAT GAGT T C AC AGAGGG C AC GGT GGTT CT GAAGC CAGGAGA(?AC C 


1442 


0\7 

wy 


1381 


CAGAAGGAGTT CTCCGT GGGCAT AAT TGAT GAC GACATT TT T GAGGAG GAT GAACACTT C 


1440 




1 1 1 1 1 1 1 1 1 1 | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1443 


CAG AAG GAGT TCTCCGTGGG CAT AAT T GAT GAC GAC AT T T T T GAG GAG GAT G AAC AC T T C 


1502 


yy 


14 41 

X 1 1 JL 


T T T GTAAGGTT GAGCAAT GT C C GC AT AGAGGAGGAGC AGC CAGAGGAGGGGAT GC CT C CA 


1500 




I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1503 


T TT GT AAGGT T GAGCAAT GT C C GCAT AGAGGAGGAGC AGC CAGAG GAG GGGAT GC CT C CA 


1562 


yy 


1 SOI 

1 Jul 


GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 


1560 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1563 


GC7\ATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 


1622 


Ov 


1561 


GTT ACCAT CTTGGAT GAT GAC CAT GCAGGCAT CTT CACTTTTGAATGT GATACTATT CAT 


1620 




I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1623 


GTT AC CAT CT T GGAT GAT GAC CAT GCAGGCAT CT T CACTT TTGAAT GT GAT ACT ATT CAT 


1682 


Ow 

yy 


1 6?1 

X w ^ J_ 


GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 


1680 




I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1683 


GT CAGT GAGAGT AT T GGT GT TAT GGAGGT CAAG GT T CT G C GGACAT CAGGT GCC C GGGGT 


1742 


Ov 


1681 


ACAGTCAT C GT CC C CTTT AG GACAGT AGAAG GGACAG C CAAGGGT GGC GGT GAGGACT TT 


1740 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
i i i i i i i i i i i i i i i i i i i i i i ( i i i i i i i i i i i i i i i i i i i i i i i i i ■ ■ ■ >< ■ ■ ■ ■ ■ ■ < 




Db 


1743 


ACAGT C AT C GT CC C CTT TAGGACAGTAGAAGGGAC AGC CAAGGGT GGC GGT GAGGACT TT 


1802 


Qy 


1741 


GAAGAC ACAT AT GGGGAGTT G GAAT T CAAGAAT GAT GAAACT GT 1784 






1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 




Db 


1803 


GAAGACACAT AT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GT 1846 





RESULT 14 
ABX56263 

ID ABX56263 standard; DNA; 2685 BP. 
XX 

AC ABX56263; 
XX 

DT 19-FEB-2003 (first entry) 
XX 



DE Human NOVlc 248057963 DNA SEQ ID 5. 
XX 

KW NOVX; human; antidiabetic; antiarteriosclerotic; anorectic; nootropic; 

KW metabolic; antimicrobial; neuroprotective; antiparkinsonian; cardiant; 

KW antilipaemic; cytostatic; immunomodulatory; gene therapy; dyslipidaemia ; 

KW cardiomyopathy; metabolic disorder; diabetes; atherosclerosis; obesity; 

KW anorexia; neurodegenerative disorder; Alzheimer f s disease; cancer; gene; 

KW Parkinson's disease; haematopoietic disorder; metabolic disturbance; 

KW metabolic syndrome X; wasting disease; ds . 
XX 

OS Homo sapiens. 
XX 

PN WO200281625-A2. 
XX 

PD 17-OCT-2002. 
XX 

PF 03-APR-2002; 
XX 

PR 03-APR-2001; 

PR 05-APR-2001; 

PR 06-APR-2001; 

PR 10-APR-2001; 

PR 12-APR-2001; 

PR 12-APR-2001; 

PR 13-APR-2001; 

PR 13-APR-2001; 

PR 13-APR-2001; 

PR 17-APR-2001; 

PR 19-APR-2001; 

PR 20-APR-2001; 

PR 24-APR-2001; 

PR 25-APR-2001; 

PR 07-JUN-2001; 

PR 26-JUN-2001; 

PR 08-AUG-2001; 

PR 13-AUG-2001; 

PR 16-AUG-2001; 

PR 14-SEP-2001; 

PR 05-OCT-2001; 

PR 31-DEC-2001; 

PR 03-JAN-2002; 

PR 04-FEB-2002; 

PR 02-APR-2002; 
XX 

PA (CURA-) CURAGEN CORP. 
XX 

PI Padigaru M, Shenoy SG, Kekuda R, Rastelli L, Mezes PD; 

PI Smithson G, Guo X, Gerlach V, Casman SJ, Boldog FL, Li L; 

PI Zerhusen BD, .Tchernev VT, Gangolli EA, Vernet CAM, Spytek KA; 

PI Malyankar UM, Patturajan M, Miller CE, Taupier RJ, Heyes MP, Ju J; 

PI Peyman JA, Catterton E, Macdougall JR, Edinger SR, Stone DJ; 

PI Mazur A; 

XX 

DR WPI; 2003-046862/04. 

DR P-PSDB; ABU12043. 
XX 

PT New isolated NOVX polypeptide useful for treating cardiomyopathy, 



2002WO-US010366. 

2001US-0281086P. 
2001US-0281906P. 
2001US-0282020P. 
2001US-0282930P. 
2001US-0283444P. 
2001US-0283512P. 
2001US-0283657P. 
2001US-0283678P. 
2001US-0283710P. 
2001US-0284234P. 
2001US-0285325P. 
2001US-0285381P. 
2001US-0286068P. 
2001US-0286292P. 
2001US-0296692P. 
2001US-0300883P. 
2001US-0311003P. 
2001US-0311973P. 
2001US-0312901P. 
2001US-0322283P. 
2001US-0327448P. 
2001US-0345734P. 
2002US-0345755P. 
2002US-0354391P. 
2002US-00114153. 



PT atherosclerosis, metabolic disorders, diabetes, obesity, infectious 

PT disease, anorexia, neurodegenerative disorders, Alzheimer's disease and 

PT cancer. 

XX 

PS Claim 3; Page 85-86; 425pp; English. 
XX 

CC This invention describes novel polypeptides, termed NOVX which have 

CC antidiabetic, antiarteriosclerotic, anorectic, metabolic, antimicrobial, 

CC neuroprotective, antiparkinsonian, antilipaemic, cytostatic, nootropic, 

CC cardiant and immunomodulatory activity. The polypeptide and any 

CC antibodies generated from it are useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease 

CC selected from a pathology associated with the NOVX polypeptide. Fragments 

CC and portions of the polynucleotides encoding NOVX polypeptides are useful 

CC to map the location of NOVX genes on a chromosome, to identify 

CC individuals from minute biological samples, as DNA markers for 

CC restriction fragment length polymorphism (RFLP) , and are useful to 

CC prepare polymerase chain reaction primers. The products of the invention 

CC can be used in gene therapy and for treating cardiomyopathy, metabolic 

CC disorders, diabetes, atherosclerosis, obesity, infectious disease, 

CC anorexia, neurodegenerative disorders, Alzheimer's disease, Parkinson's 

CC disease, immune disorders, haematopoietic disorders, and various 

CC dyslipidaemias, metabolic disturbances associated with obesity, metabolic 

CC syndrome X and wasting disorders associated with chronic diseases and 

CC various cancers. ABX56261-ABX56306 represent the polynucleotide fragments 

CC which encode the NOVX polypeptides represented in ABU12 041-ABU12086 

XX 

SQ Sequence 2685 BP; 645 A; 657 C; 741 G; 642 T; 0 U; 0 Other; 

Query Match 91.0%; Score 1694.8; DB 7; Length 2685; 

Best Local Similarity 98.2%; Pred. No. 0; 

Matches 1725; Conservative 0; Mismatches 27; Indels 4; Gaps 1; 

GAGCAGAGGCT G GT G GCT CAGGGGAC GTGCCAAGC ACAGGGC AGAACAAT GAGT C CT GT T 145 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II 

GATCCGAGGCTGGTGGCTCAGGGGACGTGCCAAGCACAGGGCAGAACAATGAGTCCTGTT 61 

CAGGGT CAT CGGACT GCAAGGAGGGT GT CAT CCT GCCAAT CT GGT ACCCGGAGAACCCTT 205 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTGCCAATCTGGTACCCGGAGAACCCTT 121 

CCCTTGGGGACAAGATTGCCAGGGTCATTGTCTATTTTGTGGCCCTGATATACATGTTCC 265 

| I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCCTTGGGGACAAGATTGCCAGGGTCATTGTCTATTTTGTGGCCCTGATATACATGTTCC 181 

TTGGGGTGTCCATCATTGCTGACCGCTTCATGGCATCTATTGAAGTCATCACCTCTCAAG 325 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

TTGGGGT GT CCAT CATT GCT GACC GCTT CAT GGCAT CTATT GAAGT CAT CACCT CT CAAG 2 41 

AGAGGGAGGT GACAATTAAGAA7YCC CAAT GGAGAAACCAGCACAACCACTATT CGGGT CT 385 
| | | I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGAGGGAGGTGACAATTAAGAAACCCAATGGAGAAACCAGCACAACCACTATTCGGGTCT 301 

GGAATGAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATAC 445 

| I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGAATGAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATAC 361 



Qy 


86 


Db 


2 


Qy 


146 


Db 


62 


Qy 


206 


Db 


122 


Qy 


266 


Db 


182 


Qy 


326 


Db 


242 


Qy 


386 


Db 


302 



Ov 


446 


TCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTA 


505 




| | | I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


362 


TCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTA 


421 


Ov 
\cy 


506 


CCATTGT AGGGAGTGCAGCCTTCAACAT GTT CAT CAT CATT GGCATCT GT GT CT ACGT GA 


565 




M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


422 


C CAT T GT AG GGAGT GC AGCCT T CAAC AT GT T CAT CAT CAT T GGC AT CT GT GT CT ACGT GA 


481 


Ov 
\iy 


566 


TCCCAGACGGAGAGACTCGCAAGATCAAGCATCTACGAGTCTTCTTCATCACCGCTGCTT 


625 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 




Db 


482 


TCCCAGACGGAGAGACTCGCAAGATCAAACATCTACGAGTCTTCTTCATCACCGCTGCTT 


541 


Qy 


626 


GGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGG 


685 




I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


542 


GGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGG 


601 


wy 


686 


TCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCT 


745 


Db 


602 


| I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

TCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCT 


661 


^y 


746 


GG GT GG CAGATAAACGACT GCT CT TCT AC AAAT ACAT GC ACAAAAAGTAC C GC ACAGAC A 


805 




| | | I I I 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


662 


GGGT GGCAGATAAACGACT GCTCTTCTACAAATACAT GCACAAAAAGTACCGCACAGACA 


721 


wy 


806 


AAC AC C GAGGAAT TAT CAT AGAGACAGAG GGT GACCACC CT AAGGG CATT GAGAT GGAT G 


865 




I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


722 


AACACC GAGGAAT TAT CATAGAGACAGAGGGT GACCACCCTAAGGGCATT GAGATGGATG 


781 


Ov 

vy 


866 


GGAAAAT GAT GAATTCCCATTTT CTAGAT GGGAACCT GGT GCCCCTGGAAGGGAAGGAAG 


925 




1 M II 1 1 1 1 1 1 1 1 1 1 I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


782 


GGAAAAT GAT GAATT C C CAT TTT CTAGAT G GGAAC CT GGT GC C C CT GGAAGG GAAGGAAG 


841 


Ov 


926 


T GGAT GAGT CC C GCAGAGAGAT GAT C C GGATT CT CAAGGAT CT GAAG CAAAAAC AC C CAG 


985 




I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


842 


T G GAT GAGT C C C G C AG AG AGAT GAT C C G GAT TCT C AAG GAT C T GAAG CAAAAAC AC C CAG 


901 


Ov 


986 


AGAAGGACT T AGATC AGCT GGT GGAGAT G GCCAATT ACT AT GCT CT T T C C C AC CAACAGA 


1045 




I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


902 


AGAAG GACT T AGAT C AGC T GGT G GAGAT GGCCAAT TACT AT GCT CT T T C C CAC CAACAGA 


961 


Ov 


1046 


AGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGTATGATGACTGGTGCAGGCAATATCC 


1105 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 II 




Db 


962 


AGAGC CGCGCCTT CT ACC GT AT C CAAGCCACT C GT AT GAT GACT GGT GCAGGCAAT AT C C 


1021 


Ov 


1106 


T GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCCT CCAGCAT GAGCGAGGT GCACACCG 


1165 




M 1 II 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1022 


TGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCCT CCAGCAT GAGCGAGGT GCACACCG 


1081 


Ov 
sdy 


1166 


ATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTACCAGTGCCTGG 


1225 




1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 M II 1 II 1 1 1 1 1 1 1 1 




Db 


1082 


AT GAGCCT GAGGACT T T AT TT C CAAG GT CT T CT TT GAC C CAT GTT CTT AC C AGT GC CT GG 


1141 


Qy 


1226 


AGAACTGT GGGGCTGTACTCCT GACAGT GGT GAGGAAAGGGGGAGACAT GTCAAAGACCA 


1285 




I | | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1142 


AGAACT GT GGGGCT GT ACT C CT GACAGT GGT GAGGAAAGGGGGAGACAT GT CAAAGAC C A 


1201 



Qy 128 6 T GTAT GT GGACTACAAAACAGAGGAT GGTT CT GCCAAT GCAGGGGCTGACT AT GAGTT CA 1345 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1202 T GT AT GT GGACT ACAAAACAGAGGAT GGT TC T GC CAAT GCAGGG GCT GACTAT GAGT T CA 12 61 

Qy 134 6 CAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACCCAGAAGGAGTTCTCCGTGGGCATAA 1405 

I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1262 C AGAGGGCAC G GT GGTT CT GAAGC CAG GAGAGAC C C AGAAG GAGT T CT CC GT GGGCATAA 1321 

Qy 1406 T T GAT G AC G AC AT T T T T GAG GAG GAT G AAC AC T T C T T T G T AAG GT T GAG CAAT G T C C G C A 1465 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1322 T TGAT GAC GACATT T TT GAGGAGGAT GAACACT T CT T T GT AAGGT T GAGCAAT GT CC GCA 1381 

Qy 14 66 T AGAGGAGGAGCAGC CAGAG GAGGG GAT GCCT CC AGCAATAT T CAAC AGT CT T C C CT T G C 1525 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1382 TAGAGGAGGAGCAGC CAGAG GAGGGGAT GCCT CCAGCAATATTCAACAGTCTTCC CTT GC 14 41 

Qy 1526 CTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGATGACCATG 1585 

II I I I I I I II I I I I I I I I I I I I I I Ill I I I I I I I I I I I I I I I I 

Db 1442 CTCGGGCTGTC CT AGCCT CC C CTT GT GT GGC CACAGT T AC CAT CT T GGAT GAT GACC AT G 1501 

Qy 1586 CAGGCAT CTT CACTTTT GAAT GT GAT AC TAT T CAT GT CAGTGAGAGTATTGGTGTTAT GG 1645 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1502 CAGGCAT CTT CACTTTT GAAT GTGATACTATT CAT GT CAGT GAGAGT ATTGGTGTTATGG 1561 

Qy 1646 AGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGTCATCGTCCCCTTTAGGACAG 1705 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1562 AGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGTCATCGTCCCCTTTAGGACAG 1621 

Qy 1706 TAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTTGAAGACACATATGGGGAGTTGGAAT 1765 

I I I I I I I I I I I I I I II I II I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 1622 TAGAAGGGACAGC CAAG GGT G GC GGT GAGGACT T T GAAGACAC AT AT GGGGAGT T GGAAT 1681 

Qy 17 66 T CAAGAAT GAT GAAACT GTAT GTGACAGACAGGAAGCT GACTAT GGAAGAAGAGGAGGCC 1825 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 1682 T CAAGAAT GAT G AAAC T GT GAAAAC C AT AAGGGT T AAAAT AGT AGAT GAGGAGGAA 1737 

Qy 1826 AAGAGGATAGCAGAGA 1841 



1738 TAC GAAAGGCAAGAGA 1753 



RESULT 15 
AAD24450 

ID AAD24450 standard; cDNA; 4087 BP. 
XX 

AC AAD24450; 
XX 

DT 07-MAY-2002 (first entry) 
XX 

DE Bovine NCX-1 cDNA. 
XX 

KW Bovine; recombinant protein; larvae expression system; membrane protein; 

KW transport protein; cardiac sodium-calcium exchange protein; Na-K ATPase; 

KW NCX1; cystic fibrosis transmembrane conductance regulator; CFTR; vaccine; 

KW channel forming protein; junctional protein; conexin 32; ss. 
XX 

OS Bos taurus . 
XX 



FH Key Location/Qualifiers 

FT CDS 268. .3180 

FT /*tag= a 

FT /product= "Bovine NCX-1 protein" 
XX 

PN WO200206464-A2. 
XX 

PD 24-JAN-2002. 
XX 

PF 09-JUL-2001; 2001WO-US021606 . 
XX 

PR 13-JUL-2000; 2000US-0218125P . 
XX 

PA (UMOR ) UNIV MISSOURI. 
XX 

PI Hale CC, Price EM; 
XX 

DR WPI; 2002-171806/22. 

DR P-PSDB; AAE18291. 
XX 

PT Producing recombinant proteins e.g. membrane, transport and channel 

PT forming proteins in larvae expression system, by infecting larvae with 

PT vector having a sequence encoding recombinant fusion protein with 

PT affinity tag. 
XX 

PS Example 1; Page 31-37; 40pp; English. 
XX 

CC The patent discloses methods of producing recombinant proteins in larvae 

CC expression system, by infecting the larvae with vector having a sequence 

CC encoding recombinant fusion protein with affinity tag. The methods are 

CC useful for producing recombinant protein, preferably membrane proteins, 

CC transport proteins such as NCX1 (cardiac sodium-calcium exchange protein) 

CC or Na-K ATPase, channel forming proteins such as cystic fibrosis trans- 

CC membrane conductance regulator (CFTR) , junctional protein (conexin 32), 

CC receptor, cytoskeletal and other membrane associated proteins. They are 

CC also useful for producing prostate specific membrane antigens and sodium 

CC phosphate co-transporters from kidney. The methods are also useful for 

CC producing recombinant fusion proteins in large quantities that are both 

CC highly homogenous and biologically active. The recombinant proteins 

CC produced by the methods of the invention can be included as part of a 

CC pharmaceutical, nutritional, drug or vaccine composition. The present 

CC sequence is a cDNA encoding bovine NCX-1 protein 
XX 

SQ Sequence 4087 BP; 1057 A; 950 C; 1057 G; 1023 T; 0 U; 0 Other; 

Query Match 43.5%; Score 810.6; DB 6; Length 4087; 
Best Local Similarity 68.5%; Pred. No. 3.7e-242; 

Matches 1211; Conservative 0; Mismatches 519; Indels 39; Gaps 5; 

Qy 46 TTTGGGCTGGTTACCTTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCA 105 

III I I I I I I I II I I I I I II I I III 

Db 307 TTTCACGTGATAGCCATGGTGGCTCTCTTGTTTTCCCATGTGGACCATATAAGTGCTGAG 366 

Qy 106 GGGGAC GTGC CAAGCAC AG G GCAGAACAAT GAGT CCT GTT C AGG GT CAT C GGACT GCAAG 165 

II II II III I I I I I I I I I I I I I I I I I I I I I 

Db 367 ACAGAAATGGAAGGAGAAGGCAACGAGACTGGCGAGTGTACTGGCTCCTATTACTGTAAG 426 



Qy 

Db 



166 GAGGGTGTCATCCTGCCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCC 225 

I I II I I I I II II I I I I I I I I I I I I I I I I I I I I I I 1 II 

427 AAGGGGGTGATTTTACCCATTTGGGAGCCCCAGGACCCTTCCTTTGGAGACAAAATTGCT 486 



Qy 226 AGGGTCATTGTCTATTTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCT 285 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I , 

Db 487 AGAGCGACTGTGTATTTTGTGGCCATGGTCTACATGTTTCTTGGAGTCTCAATCATTGCT 546 

Qy 286 GACCGCTT CAT GGCAT CT ATT GAAGT CAT CACCT CTCAAGAGAGGGAGGT GACAATTAAG 345 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 547 GAC C GGTT CAT GT C CT CT ATAGAAGT CAT CAC GT CT CAAGAGAAAGAAAT C AC C AT AAAG 606 

Qy 346 AAAC C C AAT GGAGAAAC C AGC ACAAC C ACT AT T C G GGT CT GGAAT GAAACT GT CT C CAAC 405 

I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 607 AAAC C CAAT GGAGAGACC AC CAAGACAACT GT GAG GAT CT G GAAT GAGACAGT GT C CAAC 666 

Qy 4 06 CTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTG 4 65 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 667 C T GAC CT T GAT GGC C CT GGG GT CT T C AGCTC CAGAGAT T CT C CTT T CAGTAAT C GAG GT G 726 

Qy 4 66 TGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCC 525 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 727 TGTGGCCATAACTTCACTGCAGGAGACCTTGGCCCTAGCACCATCGTGGGGAGTGCTGCA 7 86 

Qy 52 6 T T CAAC AT GT T CAT CAT CAT T G G CAT C T GT GT CT AC GT GAT C C C AG AC G GAG AG AC T C G C 585 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 87 T T C AACAT GT T CAT CAT CAT TGCCCTTTGTGT GT AT GT C GT C CC GGAT GGGGAGACAAG G 846 

Qy 586 AAGAT CAAGCAT CTACGAGT CTT CTT CAT CACCGCT GCTT GGAGT AT CTTT GCCTACAT C 645 

I I I I I I I I I I I I I I II II I I II I I II II II I I I I I I I I I I I I II I I I I 
Db 84 7 AAGAT CAAGCAT CT GCGT GT GTT CT T T GT GACAGCAGC AT GGAG CAT CT TT GCCT ATACC 906 

Qy 64 6 TGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTC 705 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 907 TGGCTTTACATCATTTTGTCTGTCAGCTCCCCTGGGGTCGTGGAGGTCTGGGAAGGTTTG 966 

Qy 7 06 CTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTG 765 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 967 CTTACTTTCTTCTTCTTCCCCATCTGCGTTGTGTTTGCTTGGGTGGCAGACAGGAGGCTT 1026 

Qy 7 66 C T C T T CT AC AAAT AC AT G C ACAAAAAGT AC C GC AC AG ACAAAC AC C GAG GAAT TAT CAT A 825 

II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1027 CTGTTTTACAAGTATGTCTACAAGAGGTATCGGGCTGGCAAGCAGAGGGGAATGATTATT 108 6 

Qy 82 6 GAGACAGAGGGTGAC CAC CC TAAGGGCATTGAGATGGATGGGAAAATGATG 876 

II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 1087 GAACACGAAGGAGAC AG G C C AT CT T C CAAGACAGAAAT T GAAAT G GAT GGGAAAGT GGT C 1146 

Qy 877 AATTCCCA T T T T CT AGAT GGGAAC CT GGT GC C C CT GGAAG GGAAG 921 

I I I I I I I I III I I I I I I I II II I I I II I II 

Db 1147 AAT T CC C AT GT T GACAGT TT CTT AGAT GGAGC C CT GGT TCT GGAGGT T GAT GAGAGGGAC 1206 

Qy 922 GAAGT G GAT G AGT C C C G C AG AG AG AT GAT C C G GAT TCT C AAG GAT CT G AAG C AAAAA 978 

III I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1207 C AAGAT GAT GAAGAAGC CAGGCGAGAAAT GGCT AGGAT TCT GAAGGAACT CAAGCAGAAG 1266 

Qy 97 9 CAC C CAGAGAAGGACT T AGAT C AG CT GGT G GAG AT GGC CAATT ACT AT GCT CTT T CC C AC 1038 



1 1 I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I III I 1 1 1 1 1 1 1 1 1 I I I II 

Db 1267 CAT C C AGAGAAGGAAAT AGAGCAAT T AAT AGAATT AGC CAAT T AC CAAGT CT TAAGT CAG 1326 

Qy 1039 CAAC AGAAGAG CCGCGCCTT CT AC C GT AT C CAAGC C ACT C GT AT GAT GACT GGT G C AGGC 1098 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1327 CAG CAAAAAAGT C GAGCGT T TT ACC GTAT T CAAGCT AC C C GC CT GAT GAC C GGAG CAGGC 13 86 

Qy 1099 AAT ATCCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCCT CCAGCAT GAGCGAGGT G 1158 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1387 AACAT TTT AAAGAGGC AT G CAGCAGAC CAAGC CAGGAAAGCT GT CAG CAT GC AT GAGGT C 1446 

Qy 1159 CAC AC C GAT GAG C CT G AGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTAC 1215 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I III 

Db 1447 AACAC G GAAGT GGCT GAAAATGAC C CT GT CAGT AAGAT CT T CT TT GAACAAGGGACAT AT 1506 

Qy 1216 CAGT GC CT GGAGAACT GT GGGGCT GT ACT CCT GACAGT GGT GAGGAAAG G GGGAGACAT G 1275 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1507 CAGT GT CT GGAGAACT GT GG CACAGT AGC C CT GAC CATT AT C C GCAGAGGT GGT GAT TT G 1566 

Qy 1276 T C AAAGAC CAT GTAT GT GGACT ACAAAACAGAG GAT GGT T CT GCCAAT GCAGGGGCT GAC 1335 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1567 ACCAACACTGTGTTT GTT GACTT CAGAACAGAGGAT GGCACAGCCAATGCTGGAT CTGAT 1626 

Qy 1336 TAT GAGT T CAC AGAGG GC AC GGT GGT T CT GAAGC C AGG AGAGAC C C AGAAGGAGT T C T C C 1395 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1627 T AC GAAT T T AC C G AAG G AAC TGTGGTCTT T AAG C C T G GT GAG AC C C AG AAG G AAAT C AGA 1686 

Qy 1396 GT GGGCAT AAT T GAT GAC GACATTT T T GAG GAGGAT GAAC ACTT C TTT GTAAGGT T GAG C 1455 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1687 GT T GG CAT CATT GAT GAT GACAT CT T T GAGGAG GAT GAGAAT T TC CT T GT GC AT CT CAGC 1746 

Qy 1456 AATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCAGCAATATTCAACAGT 1515 

I I I I I II III I I I I I I I I I I III I I I I 

Db 1747 AAC GT CAAAGTATCT T TG GAAGC CT C GGAAGAC GGCAT C CT GGAAG C CAGT 1797 

Qy 1516 CTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGAT 1575 

II II II III I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1798 CATGTCTCTACCCTTGCTTGCCTGGGATCCCCCTCCACTGCCACCGTGACTATTTTTGAT 1857 

Qy 157 6 GAT GAC CAT GC AGG CAT C T T CAC T T T T GAAT GT GAT AC TAT T CAT GT CAGT G AGAGT AT T 1635 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1858 GATGACCATGCTGGCATCTTTACTTTTGAGGAACCGGTGACTCATGTGAGTGAGAGCATT 1917 

Qy 1636 GGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGTCATCGTCCCC 1695 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1918 GGCAT CAT GGAGGT GAAAGTT CTGAGAACATCT GGAGCACGT GGAAAT GTTATCGTTC CC 1977 

Qy 1696 T T T AGGACAGT AGAAGGGACAGC CAAGG GTG GCGGT GAGGACT TT GAAGACAC AT AT GGG 1755 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II 

Db 1978 T AT AAGAC CAT T GAGGG GAC C GCCAGAGGT GGAGGGGAGGACT TT GAGGACACAT GCGGA 2037 

Qy 1756 GAGTT GGAATT CAAGAAT GAT GAAACT GT 17 84 

I I I I I I I I I I I I I I I I I I I I I I I 
Db 2038 G AGC T C GAGT T C C AGAAT GAC GAAAT T GT 2066 



Search completed: June 25, 2004, 07:40:45 



Job time : 660,599 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic 



Run on: 



nucleic search, using sw model 
June 25, 2004, 06:15:36 



Search time 142.069 Seconds 
(without alignments) 
7277.246 Million cell updates/sec 



Title: 

Perfect score: 
Sequence : 

Scoring table: 



US-10-054-680-3 
1863 

1 atggcgtggttaaggttgca . 



. ggaaagccagtattgggtga 1863 



I DENT I T Y_NUC 

Gapop 10.0 , Gapext 1.0 



1365418 



Searched: 682709 seqs, 277475446 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 

Database : Issued__Patents_NA: * 

1: /cgn2_6/ptodata/2/ina/5A_COMB. seq: * 

2 : /cgn2_6/ptodata/2/ina/5B_COMB. seq: * 

3: /cgn2_6/ptodata/2/ina/6A_COMB. seq: * 

4 : /cgn2_6/ptodata/2/ina/6B_COMB. seq: * 

5 : /cgn2_6/ptodata/2/ina/PCTUS_COMB. seq: * 

6 : / cgn2__6/ptodata/2/ina/backfilesl . seq: * 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 



SUMMARIES 



Result 



% 

Query 





No. 


Score 


Match 


Length 


DB 


ID 


Description 




1 


71.6 


3.8 


1935 


4 


US-09-701-068-3 


Sequence 


3, Appli 




2 


71.6 


3.8 


1950 


4 


US-09-701-068-1 


Sequence 


1, Appli 




3 


51.6 


2.8 


7218 


1 


US-08-232-463-14 


Sequence 


14, Appl 


c 


4 


51 


2.7 


7218 


1 


US-08-232-463-14 


Sequence 


14, Appl 




5 


44.8 


2.4 


2803 


4 


US-09-701-068-4 


Sequence 


4, Appli 




6 


38.4 


2.1 


160 


1 


US-08-182-175A-44 


Sequence 


44, Appl 




7 


38.4 


2.1 


160 


1 


US-08-474-633A-53 


Sequence 


53, Appl 




8 


38.4 


2.1 


160 


4 


US-08-823-771-53 


Sequence 


53, Appl 




9 


38.4 


2.1 


160 


5 


PCT-US92-06412-44 


Sequence 


44, Appl 


c 


10 


38.4 


2.1 


2777 


4 


US-09-310-463-3 


Sequence 


3, Appli 


c 


11 


38.4 


2.1 


2777 


4 


US-08-842-248A-3 


Sequence 


3, Appli 



c 


12 


37 . 4 


2. 


0 


289 


3 


US-09-007-005-17 


Sequence 


17, Appl 


c 


13 


37 . 4 


2 . 


0 


289 


3 


US-09-244-796-17 


Sequence 


17, Appl 


c 


14 


37.2 


2. 


0 


1320 


4 


US-09-148-545-110 


Sequence 


110, App 


c 


15 


37 


2. 


0 


1890 


3 


US-08-935-855-19 


Sequence 


19, Appl 




16 


36.8 


2. 


0 


160 


1 


US-08-182-175A-32 


Sequence 


32, Appl 




17 


36. 8 


2. 


0 


160 


1 


US-08-182-175A-34 


Sequence 


34, Appl 




18 


36.8 


2 . 


0 


160 


1 


US-08-474-633A-29 


Sequence 


29, Appl 




19 


36.8 


2. 


0 


160 


1 


US-08-474-633A-31 


Sequence 


31, Appl 




20 


36. 8 


2 . 


0 


160 


4 


US-08-823-771-29 


Sequence 


29, Appl 




21 


36. 8 


2 . 


o 


160 


4 


US-08-823-771-31 


Sequence 


31, Appl 




22 


36. 8 


2 . 


o 


160 


5 


PCT-US92-06412-32 


Sequence 


32, Appl 




23 


36. 8 


2 . 


o 


160 


5 


PCT-US92-0 64 12-34 


Sequence 


34, Appl 




24 


36. 8 


2 . 


0 


187 


1 


US-08-182-175A-90 


Sequence 


90, Appl 




25 


36. 8 


2 . 


o 


187 


1 


US-08-474-633A-78 


Sequence 


78, Appl 




26 


36 . 8 


2 . 


o 


187 


4 


US-08-823-771-78 


Sequence 


78, Appl 




27 


36 . 8 


2 . 


o 


187 


5 


PCT-US 92- 064 12-90 


Sequence 


90, Appl 


Q 


28 


36 . 8 


2 . 


o 


2790 


3 


US-08-985-950-21 


Sequence 


21, Appl 


Q 


29 


36 . 8 


2 . 


o 


2790 


4 


US-09-546-049-21 


Sequence 


21, Appl 


Q 


30 


36 . 8 


2 . 


o 


2922 


4 


US-09-310-463-1 


Sequence 


1, Appli 


Q 


31 


36. 8 


2 . 


o 


2922 


4 


US-08-842-248A-1 


Sequence 


1, Appli 




32 


36 . 6 


2 . 


o 


289 


3 


us _ 09- 007- 005- 17 


Sequence 


17, Appl 




33 


36 . 6 


2 . 


o 


289 


3 


US-09-244-796-17 


Sequence 


17, Appl 




34 


36 


1 . 


9 


505 


4 


us _ 09- 62 1-97 6- 15 639 


Sequence 


15639, A 




35 


36 


1 . 


9 


1328 


4 


US-09-599-360B-4 6 


Sequence 


46, Appl 




36 


35 . 6 


1 . 


9 


189 


3 


US- 09-4 61-697-2 13 


Sequence 


213, App 




37 


35 . 6 


1 . 


9 


195 


3 


US-09-4 61-697-2 11 


Sequence 


211, App 




38 


35 . 6 


1 . 


9 


213 


3 


US-09-4 61-697-209 


Sequence 


209, App 




39 


35 . 6 


1 . 


9 


231 


3 


US- 09-4 6 1-697-2 07 


Sequence 


207, App 




40 


35 . 6 


1 . 


9 


282 


3 


US-09-4 61-697-205 


Sequence 


205, App 




41 


35.6 


1. 


9 


306 


3 


US-09-461-697-203 


Sequence 


203, App 




42 


35.6 


1. 


9 


696 


3 


US-09-461-697-193 


Sequence 


193, App 




43 


35.6 


1. 


9 


699 


3 


US-09-461-697-191 


Sequence 


191, App 




44 


35.6 


1. 


9 


717 


3 


US-09-461-697-189 


Sequence 


189, App 




45 


35.6 


1. 


9 


774 


3 


US-09-461-697-187 


Sequence 


187, App 



ALIGNMENTS 



RESULT 1 
US-09-701-068-3 

; Sequence 3, Application US/09701068 

; Patent No. 6677506 

; GENERAL INFORMATION: 

; APPLICANT: Galil, Gad et al . 

; TITLE OF INVENTION: DNA CODING FOR A Mg2+/H+ OR Zn2+/H+ EXCHANGER AND 
TRANSGENIC PLANTS 

; TITLE OF INVENTION: EXPRESSING SAME 
; FILE REFERENCE: 01/21317 

; CURRENT APPLICATION NUMBER: US/09/701, 068 

; CURRENT FILING DATE: 2001-05-07 

; NUMBER OF SEQ ID NOS : 17 

; SOFTWARE: Patentln version 3.0 

; SEQ ID NO 3 

LENGTH: 1935 

TYPE: DNA 
; ORGANISM: Arabidopsis thaliana 



FEATURE : 
NAME/ KEY: CDS 
LOCATION: (136) . . (1755) 
US-09-701-068-3 

Query Match 3.8%; Score 71.6; DB 4; Length 1935; 

Best Local Similarity 48.2%; Pred. No. 4.8e-12; 

Matches 268; Conservative 0; Mismatches 279; Indels 9; Gaps 2; 

Qy 22 6 AGGGTCATTGTCTATTTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCT 285 

I I I I I I I I I I I I I I II III II II I I I I I I I III II 

Db 253 AGGGGTGTGTTATATTTTCTCGGTCTTGCCTACTGCTTTATTGGGTTGTCAGCCATCACT 312 

Qy 28 6 GACCGCTTCATGGCATCTATTG AAGTCAT CACCTCTCAAGAGAGGGAGGT GACAATT 342 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I If 

Db 313 GCAC GGTT CTT CAAGT CT AT GGAGAAT GT CGT GAAACAT T C C C GT AAAGT GGT TACAATT 372 

Qy 343 AAGAAACCCAAT GGAGAAACCAGCACAACCACTATT CGGGTCTGGAAT GAAACTGT CTCC 4 02 

I 1 I 11 I I I I I I I I I I I I I I I I I 

Db 373 GAT C C CAT T ACTAAAGCT GAAGT CAT CACAT ACAAGAAAGTT T GGAACTT T ACTAT T GCA 432 

Qy 403 AACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAG 4 62 

I I I I I I I I I III I I I I I I I I I II I I I I 

Db 433 GACATCAGTTTGTTGGCGTTTGGAACTAGCTTCCCTCAGATTTCTTTGGCTACCATCGAT 4 92 

Qy 463 GT GT GT GGT CAT GGGTTCATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGG 516 

I I II II I I I I I I I I I I I I I I I II II I I I I 

Db 493 GCAATACGGAATATGGGGGAGCGGTATGCTGGAGGTCTTGGTCCTGGAACACTTGTTGGC 552 

Qy 517 AGTGCAGCCTTCAACATGTTCATCATCATTGGCATCTGTGTCTACGTGATCCCAGACGGA 57 6 

II I I I I I I I I I I I I I I I I I I I I I III I I I I I 

Db 553 TCAGCTGCATTTGATCTTTTCCCCATCCACGCTGTTTGTGTCGTTGTGCCAAAAGCTGGA 612 

Qy 577 GAGACTCGCAAGAT CAAGCAT CTACGAGT CTT CTT CATCACCGCT GCTT GGAGTAT CTTT 636 

II I I I I I I I I I I I I II I I I I I I I 

Db 613 GAAC T GAAAAAGAT AT CC GACT TAG GT GT TT GGCT AGT T GAGCT C GTAT GGT CTT TTT GG 672 

Qy 637 GCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGG 696 

I I I I I I I I I I I I I I I I I I I I I I III I I I I II I II I 

Db 673 GCTTACATCTGGCTATACAT/yVTCCTCGAGGTGTGGTCACCAAACGTT^ATTACACTTGTG 732 

Qy 697 GAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGAT 756 

III I I I I I I I I I I I I I I I I I I I III 

Db 733 GAGGCATTATT GACAGTACTGCAATACGGATT GCTT CT AGTT CATGCGTAC GCCCAAGAC 7 92 

Qy 757 AAAC GACT GCT CTT CT 772 

II III II I II 

Db 7 93 AAGCGATGGCCTTACT 8 08 



RESULT 2 
US-09-701-068-1 

; Sequence 1, Application US/09701068 

; Patent No. 6677506 

; GENERAL INFORMATION: 

; APPLICANT: Galil, Gad et al . 



; TITLE OF INVENTION: DNA CODING FOR A Mg2+/H+ OR Zn2+/H+ EXCHANGER AND 
TRANSGENIC PLANTS 

; TITLE OF INVENTION: EXPRESSING SAME 
; FILE REFERENCE: 01/21317 

; CURRENT APPLICATION NUMBER: US/09/701, 068 

; CURRENT FILING DATE: 2001-05-07 

; NUMBER OF SEQ ID NOS: 17 

; SOFTWARE: Patentln version 3.0 

; SEQ ID NO 1 

; LENGTH: 1950 

TYPE: DNA 
; ORGANISM: Arabidopsis thaliana 
US-09-701-068-1 

Query Match 3.8%; Score 71.6; DB 4; Length 1950; 

Best Local Similarity 48.2%; Pred. No. 4.8e-12; 

Matches 2 68; Conservative 0; Mismatches 279; Indels 9; Gaps 2; 

Qy 226 AGGGTCATTGTCTATTTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCT 285 

I I I I I I II I I I I I I II III II I I I I I I I I I Ml II 

Db 258 AGGGGTGTGTTATATTTTCTCGGTCTTGCCTACTGCTTTATTGGGTTGTCAGCCATCACT 317 

286 GAC CGCTT CAT GGCAT CT ATT G AAGT CAT CAC CT CT CAAGAGAGG GAG GT GACAAT T 342 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

318 GCACGGTTCTTCAAGTCTATGGAGAATGTCGTGAAACATTCCCGTAAAGTGGTTACAATT 377 

Qy 343 AAGAAACCCAAT GGAGAAACCAGCACAACCACT ATTCGGGT CT GGAAT GAAACT GT CTCC 402 

I I I I I II I I I I I I I I I I I I I I I 

Db 37 8 GAT C C CAT T AC T AAAGCT GAAGT CAT C ACAT ACAAGAAAGT T T GGAACT TT ACT ATT GCA 437 

Qy 403 AACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAG 462 

I I I I I I I I I III I I I I I I I I I II I I I I 

Db 438 GACATCAGTTTGTTGGCGTTTGGAACTAGCTTCCCTCAGATTTCTTTGGCTACCATCGAT 497 

Qy 4 63 GT GT GT GGT CAT GGGTTCATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGG 516 

I III II I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 98 GCAATACGGAATATGGGGGAGCGGTATGCTGGAGGTCTTGGTCCTGGAACACTTGTTGGC 557 

Qy 517 AGT GC AGC CT T CAAC AT GT T CAT CAT CAT T G GC AT CT GT GT CT AC GT GAT C C C AGAC GGA 576 

I I I I I I I I I I I I I I I I I I I I I II III I I I I I 

Db 558 TCAGCTGCATTTGATCTTTTCCCCATCCACGCTGTTTGTGTCGTTGTGCCAAAAGCTGGA 617 

Qy 577 GAGACT C GCAAGAT CAAGCAT CT AC GAGT CT TCT T CAT CAC CGCT GCTT GGAGT ATCT TT 636 

II I I I I I I I I I I I I II I I I I I I I 

Db 618 GAAC T GAAAAAGAT AT C C GACT TAG GT GT T T GG C T AGT T GAG CT C GT AT GGTCTTTTTGG 677 

Qy 637 GCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGG 696 

II I I I I I I I I I I I I I I I I I I I I III I I I I II I M I 

Db 678 GCT T ACAT CT GGCT AT ACAT AAT C CT C GAG GT GT GGT CAC CAAAC GT AATT AC ACTT GT G 737 

Qy 697 GAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGAT 756 

Ml I I I I I I I I I I I I I I I I I I I III 

Db 738 GAGGCAT TAT T GAC AGT ACT GCAAT AC GGAT TG CT T CT AGT TCAT GC GT AC GC C CAAGAC 797 

Qy 757 AAAC GACT GCT CT TCT 772 

II III II I II 

Db 798 AAGCGATGGCCTTACT 813 



Qy 

Db 



RESULT 3 

US-08-232-463-14 

; Sequence 14, Application US/08232463 

; Patent No. 5670367 

; GENERAL INFORMATION: 

APPLICANT: DORNER, F. 

APPLICANT: SCHEIFLINGER, F. 

APPLICANT: FALKNER, F. G. 

TITLE OF INVENTION: RECOMBINANT FOWLPOX VIRUS 
NUMBER OF SEQUENCES: 52 
CORRESPONDENCE ADDRESS: 
; ADDRESSEE: Foley & Lardner 

; STREET: 1800 Diagonal Road, Suite 500 

; CITY: Alexandria 

STATE: VA 
COUNTRY : USA 
; ZIP : 22313-0299 

; COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
; COMPUTER: IBM PC compatible 

; OPERATING SYSTEM: PC-DOS/MS-DOS 

; SOFTWARE: Patentln Release #1.0, Version #1.25 

CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/232,4 63 

FILING DATE: 
; CLASSIFICATION: 435 

; PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US/07/935, 313 

FILING DATE: 

APPLICATION NUMBER: EP 91 114 300.6 
; FILING DATE: 26-AUG-1991 

ATTORNEY/AGENT INFORMATION: 
NAME: BENT, Stephen A. 
; REGISTRATION NUMBER: 29,768 

; REFERENCE/ DOCKET NUMBER: 30472/114 IMMU 

TELECOMMUNICATION INFORMATION: 
TELEPHONE: (703)836-9300 
TELEFAX: (703)683-4109 
; TELEX: 899149 

; INFORMATION FOR SEQ ID NO: 14: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 7218 base pairs 
; TYPE: nucleic acid 

; STRANDEDNESS: single 

TOPOLOGY: linear 
IMMEDIATE SOURCE: 
CLONE: pTZgpt-Fls 
US-08-232-463-14 

Query Match 2.8%; Score 51.6; DB 1; Length 7218; 

Best Local Similarity 5.9%; Pred. No. 2.7e-05; 

Matches 24; Conservative 215; Mismatches 169; Indels 0; Gaps 0 



QY 



395 CTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTT 454 



Db 107 8 YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY 1137 

Qy 455 TAAT T GAGGT GT GT GGT CAT G G GT T CAT T GCT GGT GAT CT GGGAC CTT CT ACCAT T GT AG 514 

I • • - • » • • • • • * • » • * 

Db 1138 YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY 1197 

Qy 515 GGAGT GCAGCCTTCAACAT GTT CAT CAT CATT GGCAT CT GT GT CT AC GT GAT CC CAGACG 574 

: . * . • • • • • • - • •••• • 

Db 1198 Y Y Y YYY YY Y Y Y YY Y Y Y Y Y Y Y Y Y Y YY Y YY Y YY Y Y Y Y YY Y YYY Y YYY Y YY Y YY YYY Y YY Y Y Y 1257 

Qy 575 GAGAGACT CGCAAGAT CAAGCAT CT ACGAGT CTT CTT CAT CACCGCT GCTT GGAGT AT CT 634 

. . . . . . . • a a . •••••••• a ••• 

... . . , . • a • a •••••••• aa aa aaa a aaa 

Db 12 58 Y YYY YYYY YYY YYYYY YYY YYY YYY Y YYY YYY YY YYY YYY YYY Y YYY YYY YYY YYY Y YYY 1317 

Qy 635 TTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTT 694 

... a ... •••• ■ . ..aa a ■•■••»•*••• a a a a a a a a 

... . ... aaa. a a a aaa a ,,,m,,^»m,» . • ... aaa 

Db 1318 YYY Y YY YYY YYYYYYY YYYYY YY YYYY YYYYYYYYYYYYYYYY YYYY YY YYY YYYYYYYY 1377 

Qy 695 GGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAG 754 

....... ................ . . . ....... ... . 

....... ....... .......a. • . • ....... ..a a 

Db 1378 YYY YYY YYY YYYYYYY YYYYYYY YYY YYY YYY YYY YYYYYYYY YYYY YYY YYYYY YYGTA 1437 

Qy 7 55 AT AAACGACT GCTCTT CT ACAAATACAT GCACAAAAAGT AC CGCACAG 8 02 

III I II I I I I I I I I I I I I I I I I I I 

Db 1438 CCAAATT CTT CTAT CTCTTTAACT ACTT GCATAGATAGGTAATTACAG 14 85 



RESULT 4 

US-08-232-463-14/c 

; Sequence 14, Application US/08232463 
; Patent No. 5670367 
; GENERAL INFORMATION: 

APPLICANT: DORNER, F. 
APPLICANT: SCHEIFLINGER, F. 
; APPLICANT: FALKNER, F. G. 

TITLE OF INVENTION: RECOMBINANT FOWLPOX VIRUS 
NUMBER OF SEQUENCES: 52 
; CORRESPONDENCE ADDRESS: 

; ADDRESSEE: Foley & Lardner 

STREET: 1800 Diagonal Road, Suite 500 
; CITY: Alexandria 

STATE : VA 
COUNTRY: USA 
; ZIP: 22313-0299 

COMPUTER READABLE FORM: 
; MEDIUM TYPE: Floppy disk 

; COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 
; SOFTWARE: Patentln Release #1.0, Version #1.25 

CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/232,463 
; FILING DATE: 

CLASSIFICATION: 4 35 
PRIOR APPLICATION DATA: 
; APPLICATION NUMBER: US/07/935,313 

FILING DATE: 

APPLICATION NUMBER: EP 91 114 300.6 



; FILING DATE: 26-AUG-1991 

ATTORNEY/ AGENT INFORMATION: 
; NAME: BENT, Stephen A. 

REGISTRATION NUMBER: 29,768 
; REFERENCE/ DOCKET NUMBER: 30472/114 IMMU 

; TELECOMMUNICATION INFORMATION: 

; TELEPHONE: (703)836-9300 

TELEFAX: (703)683-4109 

TELEX: 899149 
INFORMATION FOR SEQ ID NO: 14: 
; SEQUENCE CHARACTERISTICS: 

LENGTH: 7218 base pairs 
; TYPE: nucleic acid 

STRANDEDNESS: single 
; TOPOLOGY: linear 

IMMEDIATE SOURCE: 

CLONE: pTZgpt-Fls 
US-08-232-463-14 



Query Match 2.7%; Score 51; DB 1; Length 7218; 

Best Local Similarity 3.4%; Pred. No. 4.2e-05; 

Matches 9; Conservative 161; Mismatches 91; Indels 0; Gaps 0; 



Qy 


1603 


GAAT GT GAT ACT AT T CAT GT CAGT GAGAGT ATT G GT GTT ATG GAGGT CAAGGT T CT GCGG 
| | | | | | | | | : : : :::::::: : : : :::::: : : : : : : : 
GAATTTGGTACRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRR 


1662 


Db 


1445 


1386 


Qy 


1663 


AC AT CAGGT GC C C GGGGTACAGT CAT C GT C CCCT TT AGGACAGTAGAAGGGACAGC CAAG 


1722 


Db 


1385 


: : : : : : ::::::: : : :::::::::::::::: : : : 
RRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRR 


1326 


Qy 


1723 


GGT GGC GGT GAG GACT TT GAAGACACAT AT GGGGAGT T GGAAT TC AAGAAT GAT GAAACT 


1782 


Db 


1325 


j . . . . . . . • • ...... ••••• .... 

RRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRR 


1266 


Qy 


1783 


GT AT GT GAC AGAC AGGAAGCT GACT AT GGAAGAAGAGGAGGC CAAGAGGAT AGCAGAGAT 
. . . .. ... .. . ••■••»•••••••• .»»«••• .. ••••• 


1842 


Db 


1265 


, . . « . . . . .. . ••»•»••••••••• .»»«••• . . ..... 

RRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRR 


1206 


Qy 


1843 


GGGAAAGCCAGTATTGGGTGA 1863 
....... • ... .. 




Db 


1205 


. •» . ... .. 

RRRRRRRRRRRRRRRRRRRRR 1185 





RESULT 5 
US-09-701-068-4 

; Sequence 4, Application US/09701068 

; Patent No. 6677506 

; GENERAL INFORMATION: 

; APPLICANT: Galil, Gad et al . 

; TITLE OF INVENTION: DNA CODING FOR A Mg2+/H+ OR Zn2+/H+ EXCHANGER AND 
TRANSGENIC PLANTS 

; TITLE OF INVENTION: EXPRESSING SAME 
; FILE REFERENCE: 01/21317 

; CURRENT APPLICATION NUMBER: US/09/701, 068 
; CURRENT FILING DATE: 2001-05-07 
; NUMBER OF SEQ ID NOS : 17 



SOFTWARE: Patentln version 3.0 
SEQ ID NO 4 
LENGTH: 2803 
TYPE: DNA 

ORGANISM: Arabidopsis thaliana 
US-09-701-068-4 

Query Match 2.4%; Score 44.8; DB 4; Length 2803; 

Best Local Similarity 52.1%; Pred. No. 0.0021; 

Matches 100; Conservative 0; Mismatches 92; Indels 0; Gaps 0; 

Qy 477 GTTCATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTT 53 6 

III I I I I II I I I I I II I I I I I I I I I I I I I III 

Db 950 GTTTTGTCATATAGGTCTTGGTCCTGGAACACTTGTTGGCTCAGCTGCATTTGATCTTTT 1009 

Qy 537 CAT CAT CATT GGC AT C T GT GT CT AC GT GAT CC C AGAC GGAGAGACT C GCAAGAT CAAGCA 596 

I I I I I I I I I I I I I III II I I I I I I I I I I I 

Db 1010 C C C CAT C C AC G CT GT T T GT GT C GT T GT GC CAAAAGC T G GAGAAC T GAAAAAGAT AT C C GA 1069 

Qy 597 TCTACGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATAT 656 

M I I I I I I I M I III I I I I I I I I I I I I I I I I I 

Db 1070 CTTAGGTGTTTGGCTAGTTGAGCTCGTATGGTCTTTTTGGGCTTACATCTGGCTATACAT 1129 

Qy 657 GATTCTGGCAGT 668 

I I I I I I I 
Db 1130 AATCCTCGAGGT 1141 



RESULT 6 

US-08-182-175A-44 

; Sequence 44, Application US/08182175A 
; Patent No. 5559223 
; GENERAL INFORMATION: 

APPLICANT: Saverio Carl Falco 
APPLICANT: Sharon J. Keeler 
APPLICANT: Janet A. Rice 
; TITLE OF INVENTION: Synthetic Storage Proteins with Defined Structure 
Containing Pro 

NUMBER OF SEQUENCES: 113 
CORRESPONDENCE ADDRESS: 
; ADDRESSEE: E.I. du Pont de Nemours and Company 

; STREET: 1007 Market Street 

; CITY: Wilmington 

STATE: Delaware 
COUNTRY: USA 
ZIP: 19898 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy Disk 
COMPUTER: Macintosh 

OPERATING SYSTEM: Macintosh System, 6.0 
; SOFTWARE: Microsoft Word, 4.0 

; CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/ 182 , 175A 

FILING DATE: 

CLASSIFICATION: 800 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 07/743,006 



FILING DATE: 9 August 1991 
ATTORNEY/AGENT INFORMATION: 
NAME: Linda Axamethy Floyd 
REGISTRATION NUMBER: 33,692 
REFERENCE/ DOCKET NUMBER: BB 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (302) 992-4929 
TELEFAX: (302) 892-7949 
TELEX: 835420 
INFORMATION FOR SEQ ID NO: 44: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 160 base pairs 
TYPE: nucleic acid 
STRANDEDNESS : double 
TOPOLOGY: linear 
MOLECULE TYPE: DNA (genomic) 
ORIGINAL SOURCE: 
STRAIN: E. coli 
CELL TYPE: DH5 alpha 
IMMEDIATE SOURCE: 

CLONE: 82-4 
FEATURE : 

NAME/ KEY: CDS 
LOCATION: 2.. 151 
OTHER INFORMATION: 
OTHER INFORMATION: 
OTHER INFORMATION: 
OTHER INFORMATION: 
US-08-182-175A-44 



-1031 



/ f unction= "synthetic storage protein 
/product= "protein" 
/gene= "ssp" 

/standard name= "7.7.7.7.7.7.5" 



Query Match 2.1%; Score 38.4; DB 1; Length 160; 

Best Local Similarity 53.3%; Pred. No. 0.032; 

Matches 81; Conservative 0; Mismatches 71; Indels 



0; Gaps 



0; 



Qy 



Db 



1708 GAAGGGACAGCCAAGGGTGGCGGT GAGGACTTT GAAGACACATATGGGGAGTT GGAATT C 1767 
I I I I III I II I III II I I I I I I I I I I III I 

4 GGAGGAGAAGCTGAAGGCGATGGAGGAGAAGCT GAAGGCGAT GGAGGAGAAGCT GAAGGC 63 



Qy 

Db 

Qy 

Db 



1768 AAGAAT GAT GAAACT GTAT GT GACAGACAGGAAGCT GACTAT GGAAGAAGAGGAG GC CAA 1827 
I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II 

64 GAT GGAGGAGAAGCT GAAGGCGATGGAGGAGAAGCT GAAGGCGATGGAGGAGAAGCT GAA 123 

1828 GAGGAT AGCAGAGAT GGGAAAGC CAGT AT T GG 1859 

I I I I I I I I I I I I I I I I I I I 

124 GGCGAT GGAAGAGAAGAT GAAGGCGT GAT AGG 155 



RESULT 7 

US-08-474-633A-53 

; Sequence 53, Application US/08474633A 
; Patent No. 5773691 
; GENERAL INFORMATION: 

; APPLICANT: E. I. DU PONT DE NEMOURS AND 
; APPLICANT: COMPANY 

; TITLE OF INVENTION: CHIMERIC GENES AND 

TITLE OF INVENTION: METHODS FOR INCREASING 
TITLE OF INVENTION: INCREASING THE LYSINE 



TITLE OF INVENTION: AND THREONINE CONTENT 
TITLE OF INVENTION: OF THE SEEDS OF PLANTS 
NUMBER OF SEQUENCES: 107 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: E. I. DU PONT DE NEMOURS 
ADDRESSEE: AND COMPANY 
STREET: 1007 MARKET STREET 
CITY: WILMINGTON 
STATE: DELAWARE 
COUNTRY: U.S.A. 
ZIP: 19898 
COMPUTER READABLE FORM: 

MEDIUM TYPE: FLOPPY DISK 
COMPUTER: IBM PC COMPATIBLE 
OPERATING SYSTEM: PC-DOS/MS-DOS 
SOFTWARE: MICROSOFT WORD VERSION 2 . 0C 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/474 , 633A 
FILING DATE: 
CLASSIFICATION: 800 
ATTORNEY/AGENT INFORMATION: 
NAME: BARBARA C. SIEGELL 
REGISTRATION NUMBER: 30,684 
REFERENCE/ DOCKET NUMBER: BB-1037-C 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: 302-992-4 931 
TELEFAX: 302-773-0164 
TELEX: 835420 
INFORMATION FOR SEQ ID NO: 53: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 160 base pairs 
TYPE: nucleic acid 
STRANDEDNESS : double 
TOPOLOGY: linear 
MOLECULE TYPE: DNA (genomic) 
ORIGINAL SOURCE: 
STRAIN: E. coli 
CELL TYPE: DH5 alpha 
IMMEDIATE SOURCE: 

CLONE: 82-4 
FEATURE : 

NAME/ KEY: CDS 
LOCATION: 2.. 151 

OTHER INFORMATION: /function^ "synthetic 
OTHER INFORMATION: storage protein 
OTHER INFORMATION: /product^ "protein" 
OTHER INFORMATION: /gene= "ssp" 
OTHER INFORMATION: /s tandard_name= 
OTHER INFORMATION: "7.7.7.7.7.7.5" 
US-08-474-633A-53 

Query Match 2.1%; Score 38.4; DB 1; Length 160; 

Best Local Similarity 53.3%; Pred. No. 0.032; 

Matches 81; Conservative 0; Mismatches 71; Indels 0; Gaps 0; 

Qy 1708 GAAG GGACAGC CAAGGGT GG C GGT GAGGACT TT GAAGACACAT AT GGGGAGT T GGAAT T C 1767 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



4 GGAGGAGAAGCT GAAGGCGAT GGAGGAGAAGCT GAAGGCGAT GGAGGAGAAGCTGAAGGC 63 



Qy 1768 AAGAAT GAT GAAACTGTAT GT GACAGACAGGAAGCT GACTAT GGAAGAAGAGGAGGCCAA 1827 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 64 GAT G GAGGAGAAG CT GAAG GC GAT GGAG GAGAAGCT GAAGGC GAT GGAGGAGAAGCT GAA 12 3 

Qy 182 8 GAGGATAG CAGAGAT G G GAAAGCCAGT AT T GG 1859 

I I I I I I I I I I I I I I I I I I I 
Db 124 GGCGATGGAAGAGAAGAT GAAGGCGT GATAGG 155 



RESULT 8 

US-08-823-771-53 

; Sequence 53, Application US/08823771 
; Patent No. 6459019 

GENERAL INFORMATION: 
; APPLICANT: E. I. DU PONT DE NEMOURS AND 

COMPANY 

TITLE OF INVENTION: CHIMERIC GENES AND 

METHODS FOR INCREASING 
INCREASING THE LYSINE 
AND THREONINE CONTENT 
NUMBER OF SEQUENCES: 107 
CORRESPONDENCE ADDRESS: 
; ADDRESSEE: E. I. DU PONT DE NEMOURS 

; AND COMPANY 

; STREET: 1007 MARKET STREET 

CITY: WILMINGTON 
; STATE: DELAWARE 

COUNTRY: U.S.A. 
ZIP: 19898 
COMPUTER READABLE FORM: 

MEDIUM TYPE: FLOPPY DISK 
COMPUTER: IBM PC COMPATIBLE 
OPERATING SYSTEM: PC-DOS/MS-DOS 
; SOFTWARE: MICROSOFT WORD VERSION 2 . 0C 

; CURRENT APPLICATION DATA: 

; APPLICATION NUMBER: US/08/823, 771 

; FILING DATE: 24-Mar-1997 

CLASSIFICATION: <Unknown> 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 08/474,633 
FILING DATE: <Unknown> 
ATTORNEY/AGENT INFORMATION: 

NAME: BARBARA C. SIEGELL 
REGISTRATION NUMBER: 30,684 
REFERENCE/ DOCKET NUMBER: BB-1037-C 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: 302-992-4931 
TELEFAX: 302-773-0164 
TELEX: 835420 
INFORMATION FOR SEQ ID NO: 53: 
SEQUENCE CHARACTERISTICS: 
; LENGTH: 160 base pairs 

; TYPE: nucleic acid 

; STRANDEDNESS: double 

; TOPOLOGY: linear 



MOLECULE TYPE: DNA (genomic) 
ORIGINAL SOURCE: 

STRAIN: E. coli 
CELL TYPE: DH5 alpha 
IMMEDIATE SOURCE: 

CLONE: 82-4 
FEATURE : 

NAME/ KEY: CDS 
LOCATION: 2.. 151 

OTHER INFORMATION: /function^ "synthetic 
storage protein 
/product= "protein" 
/gene= "ssp" 
/ s t anda rd_name= 
"7.7.7.7.7.7.5" 
SEQUENCE DESCRIPTION: SEQ ID NO: 53: 
US-08-823-771-53 

Query Match 2.1%; Score 38.4; DB 4; Length 160; 

Best Local Similarity 53.3%; Pred. No. 0.032; 

Matches 81; Conservative 0; Mismatches 71; Indels 0; Gaps 0; 

Qy 1708 GAAGGGAC AGC CAAG GGT GGC GGT GAGGACT T T GAAGACACATAT GGGGAGT T GGAAT T C 1767 

I I I I I I I I II I I I I I I I I I I I I I I I I M I I 

Db 4 G GAG GAGAAGCT GAAGGC GAT GGAGGAGAAGCT GAAGGC GAT GGAGGAGAAGCT GAAGGC 63 

Qy 17 68 AAGAAT GAT GAAACT GT AT GT GAC AGACAGGAAGCT GACT AT GGAAGAAGAGGAGGC CAA 1827 

I I III III I I II II I I I I I I I I I I I I I I I I II 

Db 64 GAT GGAGGAGAAGCT GAAGGC GAT G GAGGAGAAG CT GAAGGC GAT GGAGGAGAAGCT GAA 123 

Qy 1828 GAGGATAGCAGAGAT GGGAAAGCCAGT ATT GG 1859 

I I I I I II I I I I I I I I MM 
Db 124 GGC GAT GGAAGAGAAGAT GAAGGC GT GAT AGG 155 



RESULT 9 

PCT-US92-06412-44 

Sequence 44, Application PC/TUS9206412 
GENERAL INFORMATION: 

APPLICANT: Saverio Carl Falco 
APPLICANT: Sharon J. Keeler 
APPLICANT: Janet A. Rice 

TITLE OF INVENTION: Synthetic Storage Proteins with Defined Structure 
Containing Pro 

NUMBER OF SEQUENCES: 113 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: E.I. du Pont de Nemours and Company 
STREET: 1007 Market Street 
CITY: Wilmington 
STATE: Delaware 
COUNTRY : USA 
ZIP: 19898 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy Disk 
COMPUTER: Macintosh 

OPERATING SYSTEM: Macintosh System, 6.0 
SOFTWARE: Microsoft Word, 4.0 



CURRENT APPLICATION DATA: 

APPLICATION NUMBER: PCT/US92/06412 
FILING DATE: 19920807 
CLASSIFICATION: 530 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 07/743,006 
FILING DATE: 9 August 1991 
ATTORNEY/AGENT INFORMATION: 
NAME: Linda Axamethy Floyd 
REGISTRATION NUMBER: 33,692 
REFERENCE/DOCKET NUMBER: BB-1031 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (302) 992-4929 
TELEFAX: (302) 892-7949 
TELEX: 835420 
INFORMATION FOR SEQ ID NO: 44: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 160 base pairs 
TYPE: NUCLEIC ACID 
STRANDEDNESS : double 
TOPOLOGY: linear 
MOLECULE TYPE: DNA (genomic) 
ORIGINAL SOURCE: 
STRAIN: E. coli 
CELL TYPE: DH5 alpha 
IMMEDIATE SOURCE: 

CLONE: 82-4 
FEATURE : 

NAME/ KEY: CDS 
LOCATION: 2.. 151 

OTHER INFORMATION: /function= "synthetic storage protein 
OTHER INFORMATION: /product^ "protein" 
OTHER INFORMATION: /gene= "ssp" 

OTHER INFORMATION: /standard__narae= "7.7.7.7.7.7.5" 
PCT-US92-06412-44 

Query Match 2.1%; Score 38.4; DB 5; Length 160; 

Best Local Similarity 53.3%; Pred. No. 0.032; 

Matches 81; Conservative 0; Mismatches 71; Indels 0; Gaps 0; 

Qy 17 08 GAAGGGACAGC CAAGGGT GGC GGT GAGGACT T T GAAGACACATAT GGGGAGT T GGAATT C 1767 

I I I I III I I I I Ml II I I I I I I I I II III I 

Db 4 GGAG GAGAAGCT GAAGG C GAT G GAG GAGAAGCT GAAGGC GAT GGAGGAGAAGCT GAAGGC 63 

Qy 17 68 AAGAATGATGAAACTGTATGTGACAGACAGGAAGCTGACTATGGAAGAAGAGGAGGCCAA 1827 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II 

Db 64 GAT GGAGGAGAAGCT GAAGGC GAT G GAGGAGAAGCT GAAGGC GAT GGAGGAGAAGCT GAA 123 

Qy 1828 GAGGATAGCAGAGAT GGGAAAGCCAGT ATT GG 1859 

I I I I I I I I I I I II I I II I I 
Db 124 GGC GAT GGAAGAGAAGAT GAAGGC GT GAT AGG 155 



RESULT 10 
US-09-310-463-3/c 

; Sequence 3, Application US/09310463A 
; Patent No. 6384203 



; GENERAL INFORMATION: 

APPLICANT: Cosman, David J. 
; APPLICANT: Anderson, Dirk M. 

APPLICANT: Borges, Luis 
; TITLE OF INVENTION: Family of Immunoregulators Designated Leukocyte 
Immunoglobulin- 

; TITLE OF INVENTION: Like Receptors (LIR) 
; FILE REFERENCE: 2 62 4 -A 

; CURRENT APPLICATION NUMBER: US/09/310, 463A 

; CURRENT FILING DATE: 1999-05-12 

; EARLIER APPLICATION NUMBER: 08/842,248 

; EARLIER FILING DATE: 1997-04-24 

; NUMBER OF SEQ ID NOS : 39 

; SOFTWARE: Patentln Ver. 2.0 

; SEQ ID NO 3 

LENGTH: 2777 

TYPE: DNA 
; ORGANISM: human 

FEATURE: 

NAME/ KEY: CDS 

LOCATION: ( 168 ).. (2126) 
US-09-310-463-3 



Query Match 2.1%; Score 38.4; DB 4; Length 2777; 

Best Local Similarity 49.0%; Pred. No. 0.23; 

Matches 102; Conservative 0; Mismatches 106; Indels 0; Gaps 0; 



Qy 


1303 


ACAGAGGAT GGTT CT GCCAAT GCAGGGGCT GACT AT GAGTT CACAGAGGGCACGGTGGTT 

1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 III 1 1 1 1 M 1 

ACAGAGCCTGGTTCAGCCCAGAGGGTGGGCTTGGGGAGGTGCCCTGCCTGCACGTGGGTC 


1362 


Db 


280 


221 


Qy 


1363 


C T G AAG C C AG GAG AG AC C C AG AAG G AGT TCTCCGTGGG C AT AAT T GAT G AC G AC AT T T T T 
M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 II 
CTGGGGCCCAGACT CAGCCC GAGACAGATCAGGACCGT GAGGAT GGGGGT CATGGCGT CT 


1422 


Db 


220 


161 


Qy 


1423 


GAGGAGGATGAACACTTCTTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCA 

II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 Ml 

CCTCCCACTGCCCTGCTCTGTGGATGGATGAGCCCTCGGTGCATGGCAGTCGTCCCTCCA 


1482 


Db 


160 


101 


Qy 


1483 


GAGGAGGGGATGCCTCCAGCAATATTCA 1510 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 

GCCCTGGAGATGCTTCAGGGAAGACCCA 73 




Db 


100 





RESULT 11 

US-08-842-248A-3/c 

; Sequence 3, Application US/08842248A 
; Patent No. 6448035 
; GENERAL INFORMATION: 

APPLICANT: Cosman, David J. 
; TITLE OF INVENTION: Family of Immunoregulators Designated 

TITLE OF INVENTION: Leukocyte Immunoglobulin-Like Receptors (LIR) 

NUMBER OF SEQUENCES: 29 

CORRESPONDENCE ADDRESS: 
; ADDRESSEE: Janis C. Henry, Immunex Corporation 

; STREET: 51 University Street 

; CITY: Seattle 



; STATE : WA 

; COUNTRY: US 

ZIP: 98101 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 

COMPUTER: IBM/PC Compatible 

OPERATING SYSTEM: Microsoft Word 7.0 

SOFTWARE: Patentln Release #1.0, Version #1.25 
; CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/842, 248A 

FILING DATE: April 24, 1997 
; CLASSIFICATION: 536 

; ATTORNEY/AGENT INFORMATION: 
; NAME: Henry, Janis C. 

REGISTRATION NUMBER: 34,347 

REFERENCE/DOCKET NUMBER: 2 624 
TELECOMMUNICATION INFORMATION: 
; TELEPHONE: (206) 587-0430 

TELEFAX: (206) 233-0644 

TELEX: 756822 
; INFORMATION FOR SEQ ID NO: 3: 
; SEQUENCE CHARACTERISTICS: 

LENGTH: 2777 base pairs 
; TYPE: nucleic acid 

STRANDEDNESS: single 

TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
IMMEDIATE SOURCE: 

LIBRARY : 18a3 
FEATURE: 
; NAME/KEY: CDS 

LOCATION: 168.. 2 123 
US-08-842-248A-3 

Query Match 2.1%; Score 38.4; DB 4; Length 2777; 

Best Local Similarity 49.0%; Pred. No. 0.23; 

Matches 102; Conservative 0; Mismatches 106; Indels 0; Gaps 0; 

Qy 1303 ACAGAGGAT GGTT CTGCCAATGCAGGGGCT GACTAT GAGTTCACAGAGGGCACGGTGGTT 1362 

I I I I I I I I I I I I I I I I III I I I I I I I I I I III 

Db 280 ACAGAGCCTGGTTCAGCCCAGAGGGTGGGCTTGGGGAGGTGCCCTGCCTGCACGTGGGTC 221 

Qy 1363 C T G AAG C C AG GAG AG AC C C AG AAG G AGT TCTCCGTGGG C AT AAT T GAT G AC GAC AT T T T T 1422 

I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 220 CTGGGGCCCAGACTCAGCCCGAGACAGATCAGGACCGTGAGGATGGGGGTCATGGCGTCT 161 

Qy 1423 GAGGAGGAT GAACACTTCT TTGTAAGGTT GAGCAAT GTCCGCATAGAGGAGGAGCAGCCA 14 82 

II I I I I I I I I I I I I I I I MM I I I I M I 

Db 160 CCTCCCACTGCCCTGCTCTGTGGATGGATGAGCCCTCGGTGCATGGCAGTCGTCCCTCCA 101 

Qy 14 83 GAGGAGGG GAT GC CT C CAGCAAT AT T C A 1510 

I II I I I II I I I I I I I I 

Db 100 GCCCTGGAGATGCTTCAGGGAAGACCCA 73 



RESULT 12 

US-09-007-005-17/C 



; Sequence 17, Application US/09007005B 

; Patent No. 6258558 

; GENERAL INFORMATION: 

; APPLICANT: Szostak, Jack W. 

; APPLICANT: Roberts, Richard W. 

; APPLICANT: Liu, Rihe 

; TITLE OF INVENTION: SELECTION OF PROTEINS USING RNA- PROTEIN 
; TITLE OF INVENTION: FUSIONS 
; FILE REFERENCE: 00786/350003 

; CURRENT APPLICATION NUMBER: US/09/007 , 005B 

; CURRENT FILING DATE: 1998-01-14 

; EARLIER APPLICATION NUMBER: 60/035,963 

; EARLIER FILING DATE: 1997-01-27 

; EARLIER APPLICATION NUMBER: 60/064,491 

; EARLIER FILING DATE: 1997-11-06 

; NUMBER OF SEQ ID NOS : 33 

; SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 17 
; LENGTH: 289 
; TYPE: RNA 

; ORGANISM: Artificial Sequence 
FEATURE: 

OTHER INFORMATION: Translation template 

FEATURE: 
; NAME /KEY: mis cofeature 
; LOCATION: (1) . . . (289) 

OTHER INFORMATION: n - A,T,C or G 
US-09-007-005-17 



Query Match 2.0%; Score 37.4; DB 3; Length 2 89; 

Best Local Similarity 6.5%; Pred. No. 0.1; 

Matches 14; Conservative 93; Mismatches 108; Indels 0; Gaps 0; 

Qy 608 TCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAG 667 

.i.i. • • . . . » . . . * * * . ... ... . • . • .. 

. | . | * .. . • • . . ... . . . . . ... ... • •• . .. 

Db 225 YCYTYGYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYN 166 

Qy 668 TCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAG 727 

Db 165 YSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYN 106 

Qy 72 8 T GT GT GT CCTT CT GGCCT GGGTGGCAGATAAACGACTGCT CTT CT ACAAATACATGCACA 787 

.......... . . • • • ........ 

.......... . ■ * ■ ■ ........ 

Db 105 YSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYCYAYTYTYGYT 46 



Qy 7 88 AAAAGT AC C G C AC AGACAAAC AC C GAG GAAT TAT C 822 

III : I : : I I : I : I : I : I I : 

Db 45 YAYAYT YT YG YT YAY AYAYT YAY G YT YAYAYT YT Y 11 



RESULT 13 

US-09-244-796-17/c 

; Sequence 17, Application US/09244796 

; Patent No. 6281344 

; GENERAL INFORMATION: 

; APPLICANT: Szostak, Jack W. 

; APPLICANT: Roberts, Richard W. 



; APPLICANT: Liu, Rihe 

; TITLE OF INVENTION: SELECTION OF PROTEINS USING RNA~ PROTEIN 

; TITLE OF INVENTION: FUSIONS 

; FILE REFERENCE: 00786/350007 

; CURRENT APPLICATION NUMBER: US/ 09/244 , 796 

; CURRENT FILING DATE: 1999-02-05 

; EARLIER APPLICATION NUMBER: 60/035,963 

; EARLIER FILING DATE: 1997-01-27 

; EARLIER APPLICATION NUMBER: 60/064,491 

; EARLIER FILING DATE: 1997-11-06 

; EARLIER APPLICATION NUMBER: 09/007,005 

; EARLIER FILING DATE: 1998-01-14 

; NUMBER OF SEQ ID NOS : 33 

SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 17 

LENGTH: 289 

TYPE: RNA 

ORGANISM: Artificial Sequence 
FEATURE : 

; OTHER INFORMATION: Translation template 
FEATURE: 

NAME/ KEY: misc_f eature 
LOCATION: (1) . . . (289) 
OTHER INFORMATION: n = A,T,C or G 
US-09-244-796-17 

Query Match 2.0%; Score 37.4; DB 3; Length 289; 

Best Local Similarity 6.5%; Pred. No. 0.1; 

Matches 14; Conservative 93; Mismatches 108; Indels 0; Gaps 0; 

Qy 608 TCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAG 667 

. . . * . . • ... . ... * ... ... . .. . .. 

, | » | . ■ * . . . . . . . . . ... * ... ... * «. . .. 

Db 225 YCYTYGYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYN 166 

Qy 668 TCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAG 727 

Db 165 YSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYN 106 

Qy 728 T GT GT GT CCTT CT GGC CT GGGT GGCAGATAAACGACT GCT CTT CT ACAAATACAT GCACA 7 87 

••«..«««•• , » . . * ........ .i.... 

.......... • . . * . ........ .[..** 

Db 105 YSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYCYAYTYTYGYT 46 

Qy 7 88 AAAAGTACCGCACAGACAAACACCGAGGAATTATC 822 

I I I : I : : I I : I : I : hi h 

Db 45 YAYAYT YT YG YT YAYAYAYT YAYG YT YAYAYT YT Y 11 



RESULT 14 

US-09-148-545-110/C 

; Sequence 110, Application US/09148545 

; Patent No. 6590075 

; GENERAL INFORMATION: 

; APPLICANT: Rosen et al . 

; TITLE OF INVENTION: 7 0 Human Secreted Proteins 
; FILE REFERENCE: PZ001P1 

; CURRENT APPLICATION NUMBER: US/09/148,545 
; CURRENT FILING DATE: 1998-09-04 



EARLIER APPLICATION NUMBER: PCT/US98/04482 
EARLIER FILING DATE: 1998-03-06 
EARLIER APPLICATION NUMBER: 60/040,162 
EARLIER FILING DATE: 1997-03-07 
EARLIER APPLICATION NUMBER: 60/040,333 
EARLIER FILING DATE: 1997-03-07 
EARLIER APPLICATION NUMBER: 60/038,621 
EARLIER FILING DATE: 1997-03-07 
EARLIER APPLICATION NUMBER: 60/040,161 
EARLIER FILING DATE: 1997-03-07 
EARLIER APPLICATION NUMBER: 60/040,626 
EARLIER FILING DATE: 1997-03-07 
EARLIER APPLICATION NUMBER: 60/040,334 
EARLIER FILING DATE: 1997-03-07 
EARLIER APPLICATION NUMBER: 60/040,336 
EARLIER FILING DATE: 1997-03-07 
EARLIER APPLICATION NUMBER: 60/040,163 
EARLIER FILING DATE: 1997-03-07 
EARLIER APPLICATION NUMBER: 60/047,615 
EARLIER FILING DATE: 1997-05-23 
EARLIER APPLICATION NUMBER: 60/047,600 
EARLIER FILING DATE: 1997-05-23 
EARLIER APPLICATION NUMBER: 60/047,597 
EARLIER FILING DATE: 1997-05-23 
EARLIER APPLICATION NUMBER: 60/047,502 
EARLIER FILING DATE: 1997-05-23 
EARLIER APPLICATION NUMBER: 60/047,633 
EARLIER FILING DATE: 1997-05-23 
EARLIER APPLICATION NUMBER: 60/047,583 
EARLIER FILING DATE: 1997-05-23 
EARLIER APPLICATION NUMBER: 60/047,617 
EARLIER FILING DATE: 1997-05-23 
EARLIER APPLICATION NUMBER: 60/047,618 
EARLIER FILING DATE: 1997-05-23 
EARLIER APPLICATION NUMBER: 60/047,503 
EARLIER FILING DATE: 1997-05-23 
EARLIER APPLICATION NUMBER: 60/047,592 
EARLIER FILING DATE: 1997-05-23 
EARLIER APPLICATION NUMBER: 60/047,581 
EARLIER FILING DATE: 1997-05-23 
EARLIER APPLICATION NUMBER: 60/047,584 
EARLIER FILING DATE: 1997-05-23 
EARLIER APPLICATION NUMBER: 60/047,500 
EARLIER FILING DATE: 1997-05-23 
EARLIER APPLICATION NUMBER: 60/047,587 
EARLIER FILING DATE: 1997-05-23 
EARLIER APPLICATION NUMBER: 60/047,492 
EARLIER FILING DATE: 1997-05-23 
EARLIER APPLICATION NUMBER: 60/047,598 
EARLIER FILING DATE: 1997-05-23 
EARLIER APPLICATION NUMBER: 60/047,613 
EARLIER FILING DATE: 1997-05-23 
EARLIER APPLICATION NUMBER: 60/047,582 
EARLIER FILING DATE: 1997-05-23 
EARLIER APPLICATION NUMBER: 60/047,596 
EARLIER FILING DATE: 1997-05-23 
EARLIER APPLICATION NUMBER: 60/047,612 



EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 



: 1997-05-23 

NUMBER: 60/047,632 
: 1997-05-23 

NUMBER: 60/047, 601 
: 1997-05-23 

NUMBER: 60/043, 580 
: 1997-04-11 

NUMBER: 60/043, 568 
: 1997-04-11 

NUMBER: 60/043,314 
: 1997-04-11 

NUMBER: 60/043, 569 
: 1997-04-11 

NUMBER: 60/043, 311 
: 1997-04-11 

NUMBER: 60/043, 671 
: 1997-04-11 

NUMBER: 60/043, 674 
: 1997-04-11 

NUMBER: 60/043, 669 
: 1997-04-11 

NUMBER: 60/043, 312 
: 1997-04-11 

NUMBER: 60/043, 313 
: 1997-04-11 

NUMBER: 60/043,672 
: 1997-04-11 

NUMBER: 60/043, 315 
: 1997-04-11 

NUMBER: 60/048, 974 
: 1997-06-06 

NUMBER: 60/056, 886 
: 1997-08-22 

NUMBER: 60/056, 877 
: 1997-08-22 

NUMBER: 60/056, 889 
: 1997-08-22 

NUMBER: 60/056,893 
: 1997-08-22 

NUMBER: 60/056, 630 
: 1997-08-22 

NUMBER: 60/056, 878 
: 1997-08-22 

NUMBER: 60/056, 662 
: 1997-08-22 

NUMBER: 60/056,872 
: 1997-08-22 

NUMBER: 60/056, 882 
: 1997-08-22 

NUMBER: 60/056,637 
: 1997-08-22 

NUMBER: 60/056,903 
: 1997-08-22 

NUMBER: 60/056,888 
: 1997-08-22 

NUMBER: 60/056, 879 
: 1997-08-22 



EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 
EARLIER FILING DATE: 
EARLIER APPLICATION 



NUMBER: 60/056, 880 

1997-08-22 
NUMBER: 60/056, 894 

1997-08-22 
NUMBER: 60/056, 911 

1997-08-22 
NUMBER: 60/056, 636 

1997-08-22 
NUMBER: 60/056, 874 

1997-08-22 
NUMBER: 60/056, 910 

1997-08-22 
NUMBER: 60/056, 864 

1997-08-22 
NUMBER: 60/056, 631 

1997-08-22 
NUMBER: 60/056, 845 

1997-08-22 
NUMBER: 60/056, 892 

1997-08-22 
NUMBER: 60/047, 595 

1997-05-23 
NUMBER: 60/057,761 

05-Sep-1997 
NUMBER: 60/047,599 

1997-05-23 
NUMBER: 60/047, 588 

1997-05-23 
NUMBER: 60/047, 585 

1997-05-23 
NUMBER: 60/047, 586 

1997-05-23 
NUMBER: 60/047,590 

1997-05-23 
NUMBER: 60/047, 594 

1997-05-23 
NUMBER: 60/047,589 

1997-05-23 
NUMBER: 60/047,593 

1997-05-23 
NUMBER: 60/047,614 

1997-05-23 
NUMBER: 60/043,578 

1997-04-11 
NUMBER: 60/043,576 

1997-04-11 
NUMBER: 60/047,501 

1997-05-23 
NUMBER: 60/043, 670 

1997-04-11 
NUMBER: 60/056, 632 

1997-08-22 
NUMBER: 60/056, 664 

1997-08-22 
NUMBER: 60/056,876 

1997-08-22 
NUMBER: 60/056,881 



; EARLIER FILING DATE: 1997-08-22 

; EARLIER APPLICATION NUMBER: 60/056,909 

; EARLIER FILING DATE: 1997-08-22 

; EARLIER APPLICATION NUMBER: 60/056,875 

; EARLIER FILING DATE: 1997-08-22 

; EARLIER APPLICATION NUMBER: 60/056,862 

; EARLIER FILING DATE: 1997-08-22 

; EARLIER APPLICATION NUMBER: 60/056,887 

; EARLIER FILING DATE: 1997-08-22 

; EARLIER APPLICATION NUMBER: 60/056,908 

; EARLIER FILING DATE: 1997-08-22 

; EARLIER APPLICATION NUMBER: 60/048,964 

; EARLIER FILING DATE: 1997-06-06 

; EARLIER APPLICATION NUMBER: 60/057,650 

; EARLIER FILING DATE: 1997-09-05 

; EARLIER APPLICATION NUMBER: 60/056,884 

; EARLIER FILING DATE: 1997-08-22 

; NUMBER OF SEQ ID NOS : 28 0 

; SOFTWARE: Patentln Ver. 2.0 

; SEQ ID NO 110 

; LENGTH: 1320 

Query Match 2.0%; Score 37.2; DB 4; Length 1320; 

Best Local Similarity 47.7%; Pred. No. 0.33; 

Matches 105; Conservative 1; Mismatches 114; Indels 0; Gaps 0; 

Qy 554 GT GT CT AC GT GAT C C C AGAC G GAGAGACT C GCAAGAT C AAGC AT CT AC GAGT CTT CT T C A 613 

I I I I I I I I I I I I I I I I I I I I I I I II I II 

Db 810 GTGTCACCGTCATCCCAGCCACGGCTGCTCGCCCCAGGTGACAGTGTGGCAGCTGAAGTC 751 

Qy 614 TCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCT 673 

I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 750 TCCCGGCTGCCAGGGCTCACTTCCAAGCTTACAGAACTCGTGTCACTCATTGTGTCAGCT 691 

Qy 674 CCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTG 733 

II II I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 690 CCTGTGCCATCCACCTGGGTGTCAATGGCCTCCACAAGCCCCCGCCATTTCCACTCTGTC 631 

Qy 734 TCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTA 773 

MINI III III 1111:111 

Db 630 TC CT T CAT CT C AG GCACAT AGAAGT CT CC CT GC C S T G C CA 591 



RESULT 15 

US-08-935-855-19/c 

; Sequence 19, Application US/08935855 

; Patent No. 6066485 

; GENERAL INFORMATION: 

APPLICANT: Guthridge, Mark 
; APPLICANT: Basilico, Claudio 

; TITLE OF INVENTION: NOVEL GROWTH FACTOR INDUCIBLE 

TITLE OF INVENTION: SERINE/THREONINE PHOSPHATASE, FIN13 
NUMBER OF SEQUENCES: 22 
CORRESPONDENCE ADDRESS: 
; ADDRESSEE: David A. Jackson, Esq. 

STREET: 411 Hackensack Ave, Continental Plaza, 4th 
STREET: Floor 



CITY: Hackensack 
; STATE: New Jersey 

COUNTRY: USA 
; ZIP: 07601 

COMPUTER READABLE FORM: 
; MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/935, 855 

FILING DATE: 

CLASSIFICATION: 435 
; ATTORNEY/AGENT INFORMATION: 
; NAME: Jackson Esq., David A. 

; REGISTRATION NUMBER: 26,742 

REFERENCE/ DOCKET NUMBER: 1049-1-002 CIP 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: 201-487-5800 

TELEFAX: 201-343-1684 
; INFORMATION FOR SEQ ID NO: 19: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 1890 base pairs 
; TYPE: nucleic acid 

STRANDEDNESS: double 

TOPOLOGY: linear 
; MOLECULE TYPE: cDNA 
; HYPOTHETICAL: NO 
; ORIGINAL SOURCE: 
; ORGANISM: Homo sapiens 

US-08-935-855-19 

Query Match 2.0%; Score 37; DB 3; Length 1890; 

Best Local Similarity 53.9%; Pred. No. 0.49; 



Matches 76; Conservative 0; Mismatches 65; Indels 0; Gaps 0; 

Qy 582 TC GCAAGAT CAAGC AT CT AC GAGT CTT CTT C AT CACC GCT GCT T GGAGT AT CT T T G C CTA 641 

III I I I I I I I I I II I I I I I I I I II III I I I I 

Db 949 TCCCTGGCACCATCATCTCTTCTTCTTCTTCTTCATCGTCCTCTTCAGCCTCCTCGGTGT 890 

Qy 642 CATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGG 701 

I I I I III I I I II I I I I I I III I I II I I I 

Db 889 CATCCTCATCTTCCTCATTCTCTGCCTCCTCACTGCTGTAGCCATCCTCTTCCTCGCTGC 830 

Qy 702 CCTCCTCACTCTCTTCTTCTT 722 

I I I I I I I I I II I I I I I I 

Db 829 ATTCCTCACTGTCTTCCTCTT 809 



Search completed: June 25, 2004, 15:37:22 
Job time : 143.069 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 



Run on: 



Title: 

Perfect score: 
Sequence : 

Scoring table: 



June 25, 2004, 07:13:27 ; Search time 753.008 Seconds 

(without alignments) 
11333.972 Million cell updates/sec 

US-10-054-680-3 
1863 

1 atggcgtggttaaggttgca ggaaagccagtattgggtga 1863 

IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 



3017426 seqs, 2290544650 residues 



Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



6034852 



Post-processing: 



Minimum Match 0% 
Maximum Match 100% 
Listing first 45 summaries 



Database 



Published_Applications_NA: * 

1 : /cgn2_6/ptodata/l/pubpna/US07_PUBCOMB. seq: * 

2 : /cgn2_6/ptodata/l/pubpna/PCT_NEW_PUB. seq: * 

3 : /cgn2_6/ptodata/l/pubpna/US06_NEW_PUB. seq: * 

4 : /cgn2_6/ptodata/l/pubpna/US06_PUBCOMB. seq: * 

5: /cgn2_6/ptodata/l/pubpna/US07_NEW_PUB. seq: * 

6 : /cgn2_6/ptodata/l/pubpna/PCTUS_PUBCOMB . seq: * 

7: /cgn2_6/ptodata/l/pubpna/US08_NEW_PUB. seq:* 

8: /cgn2_6/ptodata/l/pubpna/US08_PUBCOMB.seq: * 

9: /cgn2_6/ptodata/l/pubpna/US09A_PUBCOMB. seq:* 

10: /cgn2_6/ptodata/l/pubpna/US09B_PUBCOMB.seq: * 

11 : /cgn2_6/ptodata/l/pubpna/US09C_PUBCOMB. seq: * 

12 : /cgn2_6/ptodata/l/pubpna/US09_NEW_PUB. seq: * 

13 : /cgn2_6/ptodata/l/pubpna/US09_NEW_PUB. seq2 : * 

14 : /cgn2_6/ptodata/l/pubpna/US10A_PUBCOMB. seq: * 

15: /cgn2_6/ptodata/l/pubpna/US10B_PUBCOMB.seq: * 

16: /cgn2_6/ptodata/l/pubpna/US10C_PUBCOMB.seq:* 

17 : / cgn2_6/ptoda ta/ 1/pubpna /US 1 0_NEW_PUB . seq : * 

18 : /cgn2_6/ptodata/l/pubpna/US60_NEW_PUB.seq:* 

19: /cgn2_6/ptodata/l/pubpna/US60_PUBCOMB. seq:* 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 

SUMMARIES 



Result 



Query 



No. Score Match Length DB ID 



Description 





1 


1863 


100, 


.0 


1863 


14 


US-10-054-680-3 


Sequence 3, Appli 




2 


1784.6 


95, 


.8 


2766 


14 


US-10-054-680-1 


Sequence 1, Appli 




3 


1784.6 


95. 


. 8 


3812 


14 


US-10-054-680-5 


Sequence 5, Appli 




4 


1784.4 


95. 


.8 


2534 


15 


US-10-256-537-1 


Sequence 1, Appli 




5 


1784.4 


95. 


. 8 


2534 


15 


US-10-256-537-3 


Sequence 3, Appli 




6 


1783 


95. 


.7 


2781 


15 


US-10-275-116-1 


Sequence 1, Appli 




7 


1783 


95. 


.7 


2782 


9 


US-09-804-474A-1 


Sequence 1, Appli 




8 


1782.8 


95. 


.7 


126512 


9 


US-09-804-474A-3 


Sequence 3, Appli 




9 


1782.4 


95. 


,7 


2813 


15 


US-10-114-153-1 


Sequence 1, Appli 




10 


1782.4 


95. 


,7 


2840 


15 


US-10-114-153-3 


Sequence 3, Appli 




11 


1694.8 


91. 


,0 


2685 


15 


US-10-114-153-5 


Sequence 5, Appli 




12 


821.4 


44. 


1 


823 


15 


US-1 0-02 9-38 6-202 65 


Seauence 20265 A 




13 


810.6 


43. 


5 


4087 


9 


US-09-901-419-1 


Sequence 1, Appli 




14 


785.2 


42. 


1 


1836 


9 


US-09-8 64-761-16939 


Sequence 16939, A 




15 


783.2 


42. 


0 


6106 


16 


US-10-062-674-1648 


Sequence 1648, Ap 




16 


713.4 


38. 


3 


3004 


16 


US-10-388-934-506 


Sequence 506, App 




17 


692.4 


37. 


2 


4282 


15 


US-10-281-866-1 


Seauence 1 Annl i 




18 


692.4 


37. 


2 


4282 


15 


US-10-281-866-3 


Seauence 3. Ann! i 




19 


503.4 


27. 


0 


505 


15 


US-10-029-386-6536 


Sequence 6536, Ap 




20 


494 


26. 


5 


551 


15 


US-10-029-386-4103 


Sequence 4103, Ap 




21 


366 


19. 


6 


366 


15 


US-1 0-029-38 6-17 8 04 


Sequence 17804, A 




22 


334.4 


17. 


9 


507 


15 


US-10-029-386-4003 


Sequence 4003, Ap 




23 


180 


9. 


7 


180 


15 


US- 10-02 9-38 6-17706 


Sequence 17706, A 




24 


164.2 


8. 


8 


459 


9 


US-09-864-761-102 


Seauence 102 Ann 




25 


146.6 


7. 


9 


1132 


16 


US-10-369-4 93-30006 


Sequence 30006, A 




26 


91.4 


4. 


9 


1792 


16 


US-10-369-493-29835 


Sequence 29835, A 




27 


79 


4. 


2 


477 


10 


US-09-918-995-2005 


Sequence 2005, Ap 




28 


79 


4. 


2 


1187 


13 


US-10-243-552-809 


Sequence 809, App 




29 


71.6 


3. 


8 


1617 


9 


US-09-938-842A-2591 


Sequence 2591, Ap 




30 


71.6 


3. 


8 


1617 


11 


US-09-938-842A-2591 


Sequence 2591, Ap 




31 


58.2 


3. 


1 


862 


13 


US-10-424-599-86000 


Sequence 86000, A 




32 


39.6 


2. 


1 


1635 


13 


US-1 0-2 82-122A-29169 


Sequence 29169, A 




33 


39.6 


2. 


1 


30306 


13 


US-10-087-192-523 


Sequence 523, App 




34 


38.6 


2. 


1 


750 


13 


US-10-027-632-18725 


Sequence 18725, A 




35 


38.6 


2. 


1 


750 


16 


US-10-027-632-18725 


Sequence 18725, A 




36 


38.4 


2. 


1 


160 


15 


US-10-023-066A-53 


Sequence 53, Appl 


c 


37 


38.4 


2. 


1 


2777 


15 


US-10-139-662-3 


Seauence 3. Ann! i 


c 


38 


38.4 


2. 


1 


2777 


15 


US-10-139-683-3 


Sequence 3, Appli 


c 


39 


38.4 


2. 


1 


2777 


15 


US-10-143-618-3 


Sequence 3, Appli 


c 


40 


38.4 


2. 


1 


2897 


13 


US-10-240-425-366 


Sequence 366, App 




41 


37.8 


2. 


0 


1566 


13 


US-10-424-599-77447 


Sequence 77447, A 




42 


37.8 


2. 


0 


1638 


13 


US-10-282-122A-29556 


Sequence 29556, A 




43 


37.4 


2. 


0 


1504 


9 


US-09-822-849A-214 


Sequence 214, App 


c 


44 


37.4 


2. 


0 


2946 


16 


US-10-369-493-33761 


Sequence 33761, A 




45 


37.2 


2. 


0 


903 


13 


US-10-424-599-131200 


Sequence 131200, 



ALIGNMENTS 



RESULT 1 
US-10-054-680-3 

; Sequence 3, Application US/10054680 
; Publication No. US20020132998A1 
; GENERAL INFORMATION: 



; APPLICANT: Friddle, Carl Johan 
; APPLICANT: Hilbun, Erin 

; TITLE OF INVENTION: No. US20020132998Alel Human Ion Exchanger Proteins and 

Polynucleotides Encoding the 

; TITLE OF INVENTION: Same 

; FILE REFERENCE: LEX-0301-USA 

; CURRENT APPLICATION NUMBER: US/10/054, 680 

; CURRENT FILING DATE: 2002-01-22 

; PRIOR APPLICATION NUMBER: US 60/263,384 

; PRIOR FILING DATE: 2001-01-23 

; NUMBER OF SEQ ID NOS : 5 

; SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 3 

LENGTH: 1863 

TYPE: DNA 
; ORGANISM: homo sapiens 
US-10-054-680-3 

Query Match 100.0%; Score 1863; DB 14; Length 1863; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 18 63; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 AC AGGGCAGAACAAT GAGT C CT GTT CAGGGT CAT C GGACT GCAAGGAG GGT GT CAT CCT G 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I II I I I II I I I I I I I I I I I I I I 

Db 121 ACAGG G C AGAACAAT GAGT CCT GTT CAGG GT CAT C GGACT GCAAGGAGGGT GT CAT CCT G 180 

Qy 181 C CAAT CT GGTAC CC G GAGAAC CCTTCCCTT GGG GACAAGATT GCCAGG GTCATT GT CTAT 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I 
Db 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 T CTAT T GAAGT CAT C ACCT CT CAAGAGAG GGAGGT GACAATTAAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I 
Db 301 T CTAT T GAAGT CAT CACC T CT CAAGAGAGGGAG GT GACAATTAAGAAAC C CAAT GGAGAA 360 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 42 0 

I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 48 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 4 81 AT T GCT GGT GAT CT GG GAC CT T CT AC CAT T GT AG G GAGT GC AG C CT T C AAC AT GTT CAT C 540 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 AT T GC T GGT GAT CT GGGAC CTT C T AC CAT T GT AGGGAGT G CAGC CT T CAACAT GTT CAT C 540 



541 AT CAT T GGCAT CT GT GT CTAC GT GAT C C CAGAC GGAGAGACT CGCAAGAT CAAGC AT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
541 AT CAT T G G CAT C T GT GT C T AC GT GAT C C CAGAC G GAG AG AC T C G C AAG AT C AAG CAT C T A 600 

601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTAC7WVTAC 7 80 

781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

781 AT G C AC AAAAAGT AC C G C AC AGAC AAAC AC C GAG GAAT TAT C AT AGAGAC AG AG G GT G AC 840 

841 CACCCTAAGGGCATTGAGATGGATGGGAAAATGATGAATTCCCATTTTCTAGATGGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 CACCCTAAGGGCATT GAGATGGATGGGAAAAT GAT GAATTCCCATTTT CTAGATGGGAAC 900 

901 CTGGT GCCC CT GGAAGGGAAGGAAGT GGATGAGT CCCGCAGAGAGAT GAT CCGGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

901 CT GGT GCC C CT GGAAGGGAAGGAAGT GGAT GAGT C C C GC AGAGAGAT GAT CC G GATT CT C 960 

961 AAGGAT CT GAAGCAAAAAC AC C CAGAGAAGGACT T AGAT CAGCTGGTGGAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

961 AAGGAT CTGAAGCAAAAACAC C CAGAGAAGGACT T AGAT CAGCTGGTG GAGAT GG C CAAT 1020 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
1021 TACTATGCTCTTTCCCACCAACAGT^AGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

1081 AT GAT GACT GGT GCAGGCAATATCCT GAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1081 AT GAT GACT GGT GCAGGCAATAT CCT GAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1140 

1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 T C CAGCAT GAG C GAGGT GC ACAC CGAT GAGC CT GAGGACT TT ATT T CCAAGGT CT T C TT T 1200 

1201 GAC CC AT GT TCT T AC CAGT GC CT GGAGAACT GT GG GGCT GTACT C C T GACAGT GGT GAG G 12 60 

II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1201 GACCC AT GT TCT T AC CAGT GC CT GGAGAACT GT GGGGCT GTACT C C T GACAGT GGT GAG G 1260 

1261 AAAGG GGGAGAC AT GT CAAAGACCAT GT ATGT G GACT ACAAAACAGAGGAT GGTT C T GC C 1320 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

1261 AAAGGGGGAGACATGT CAAAGACCAT GTATGT GGACTACAAAACAGAGGATGGTT CTGC C 1320 

1321 AAT GCAGG GGCT GACT AT GAGTT CAC AGAGGGC AC G GTGGTT CT GAAGC CAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

1321 AAT GCAGG GGCT GACT AT GAGTT CAC AGAGGGC AC G GT GGTT CT GAAGC CAGGAGAGAC C 1380 



Qy 

Db 



1381 
1381 



CAGAAGGAGT TCT CCGT GGGCATAATT GATGAC GACATTTTTGAGGAGGATGAACACTT C 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAGAAG GAGT T C T C C GT GGG CATAAT T GAT GAC GAC ATT T TT GAGGAGGAT GAACACTT C 



1440 
1440 



Qy 1441 TT T GT AAGGT T GAGCAAT GT CC G CAT AGAGGAGGAG CAG C CAGAGGAGGGGAT G C CT CCA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 T T T GT AAG GT T GAG C AAT GT C C G CAT AG AG GAG GAG CAG C CAG AG GAG G G GAT G C C T C C A 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 

Qy 1561 GT T AC CAT CT T G GAT GAT GAC CAT G C AGG C AT CT T C ACT T T T GAAT GT GAT ACT AT T CAT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 GTTACCATCTTGGATGATGACCATGCAGGCATCTTCACTTTTGAATGTGATACTATTCAT 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1621 GT CAGT GAGAGT AT T G GT GT T AT GGAGGT C AAG GTT CTGC GGACAT CAGGT GC C CGGGGT 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 

Qy 1741 GAAGACACAT AT GGGGAGTT GGAATT CAAGAAT GATGAAACTGTAT GTGACAGACAGGAA 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 GAAGACACAT AT GGGGAGTT GGAATT CAAGAAT GATGAAACT GTAT GTGACAGACAGGAA 

Qy 1801 GCT GAC TAT GGAAGAAGAGGAG GC CAAGAGGAT AGC AGAGAT G GGAAAGC CAGT ATT GGG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 GCTGACTAT GGAAGAAGAGGAGGCCAAGAGGAT AGCAGAGAT GGGAAAGCCAGTATTGGG 

Qy 1861 TGA 1863 

I I I 

Db 1861 TGA 1863 
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Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGT CAT CGGACT GCAAGGAGGGT GTCAT C CTG 180 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I 
Db 121 ACAGGGCAGAACAAT GAGT C CT GT T CAGGGT CAT C GGACT GCAAG GAGGGT GTCAT C CTG 180 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTA^ 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CCAAT CT GGTACCCGGAGAACCCTTCC CTTGGGGACAAGATTGC CAGGGTCATT GTCTAT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 T CT AT T GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT T AAGAAACC CAAT GGAGAA 360 

I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 T CTATTGAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAATTAAGAAACC CAATGGAGAA 360 

Qy 361 ACCAGCACAACCACT ATT C GGGT CT GGAAT GAAACT GT CT CCAACCTGACCCTTAT GGCC 420 

I I I I II II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 4 81 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 54 0 

Qy 541 AT CATT GGCAT CT GT GT CTAC GT GAT C C C AGAC GGAGAGACT C GCAAGAT CAAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 AT CATT GGCAT CT GT GT CTAC GT GAT C CCAGAC GGAGAGACT CG CAAGAT CAAGCAT CTA 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I 1 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

781 AT GC ACAAAAAGT AC CGC ACAGACAAACAC C GAGGAAT TAT CAT AGAGACAGAG GGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

781 AT GC ACAAAAAGT AC C GCAC AGACAAACAC C GAGGAAT TAT CAT AGAGACAGAG GGT GAC 84 0 

8 41 C AC C CT AAG G GC ATT GAGAT G GAT G G GAAAAT GAT GAAT T C C CAT TTT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

841 CAC CCTAAGGGCATT GAGATGGAT GGGAAAAT GAT GAATTCCCATTTT CTAGAT GGGAAC 900 

901 CT GGT GC CCCT GGAAGGGAAGGAAGT GGAT GAGTCCCGCAGAGAGAT GAT CCGGAT T CTC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

901 CTGGT GCCCCT GGAAGGGAAGGAAGTGGAT GAGT CCC GCAGAGAGAT GAT C CGGATTCTC 960 



961 



1020 



AAGGAT CT GAAGCAAAAACAC CCAGAGAAGGACT T AGAT CAGCT GGT G GAGAT GGC CAAT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 AAG GAT CT GAAGCAAAAACAC CCAGAGAAGGACT T AGAT CAGCT GGT GGAGAT GGCCAAT 1020 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCT^GCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 
1021 T AC TAT GCTCTTTCC CAC C AAC AG AAG AG CCGCGCCTT CT AC C GT AT C C AAG C CAC T C GT 108 0 

1081 AT GAT GACT GGT G CAGGCAAT AT C CT GAAGAAACAT G CAGCAGAACAAGC CAAGAAGGCC 1140 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I 
1081 AT GAT GACT G GT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGG C C 1140 

1141 T CCAGCAT GAG C GAGGT GCAC ACC GAT GAG C CT GAGGACT T TAT T T C CAAGGT CTT CT TT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 T CCAGCAT GAGC GAGGT GCAC AC C GAT GAGC CT GAGGACT T TAT TT C CAAGGT CT T CT TT 1200 

1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
1201 GACC CAT GTT CTT ACCAGT GCCT GGAGAACT GT GGGGCT GTACT CCT GACAGT GGT GAGG 1260 

1261 AAAGGGGGAGACAT GTCAAAGACCAT GTAT GTGGACTACAAAACAGAGGAT GGTTCTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 AAAGGGG GAGACAT GT CAAAGAC CAT GTAT GT GGACTACAAAAC AGAGGAT GGTT CT GCC 1320 

1321 AAT GCAGGGGCTGACT AT GAGTT CACAGAGGGCACGGTGGTTCT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 AAT GCAGGGGCT GACTAT GAGTT CACAGAGGGCACGGT GGTTCT GAAGC CAGGAGAGACC 1380 

1381 CAGAAG GAGTT CT CCGT GGGC AT AAT T GAT GAC GAC ATTT T T GAGGAGGAT GAACACT T C 144 0 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II I I I I I I I I I 
1381 CAGAAGGAGT TCT C CGT GGGCAT AAT T GAT GAC GAC ATTTT T GAGGAG GAT GAACACTT C 1440 

1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

1561 GT T AC CAT C T T G GAT GAT GAC CAT G C AG G CAT CTT CAC T T T T GAAT GT GAT AC TAT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 GT TAC CAT C T T GGAT GAT GAC CAT GC AGGCAT CTT C ACT T TT GAAT GT GAT ACT AT T CAT 1620 



Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

Qy 1741 GAAGACACAT AT GGG GAGTT G GAAT T CAAGAAT GAT GAAACT GT AT GT GACAGACAG GAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 1741 GAAGACACAT AT GGGGAGTT GGAATT CAAGAAT GATGAAAC T GT GAAAAC C AT AAG 1796 

Qy 1801 GCT GACTAT GGAAGAAGAGGAGGCCAAGAGGATAGCAGAGA 1841 

III I I I I II I I I I I I I I I I I I M 

Db 1797 GGT TAAAAT AGT AGAT GAGGAGGAAT AC GAAAG GCAAGAGA 1837 



RESULT 3 
US-10-054-680-5 

Sequence 5, Application US/10054680 
Publication No. US20020132998A1 
GENERAL INFORMATION: 
APPLICANT: Friddle, Carl Johan 
APPLICANT: Hilbun, Erin 

TITLE OF INVENTION: No. US20020132998Alel Human Ion Exchanger Proteins and 
Polynucleotides Encoding the 
TITLE OF INVENTION: Same 
FILE REFERENCE: LEX-0301-USA 
CURRENT APPLICATION NUMBER: US/ 10/054 , 680 
CURRENT FILING DATE: 2002-01-22 
PRIOR APPLICATION NUMBER: US 60/263,384 
PRIOR FILING DATE: 2001-01-23 
NUMBER OF SEQ ID NOS : 5 

SOFTWARE: FastSEQ for Windows Version 4.0 
SEQ ID NO 5 
LENGTH: 3812 
TYPE: DNA 

ORGANISM: homo sapiens 
US-10-054-680-5 

Query Match 95.8%; Score 1784.6; DB 14; Length 3812; 

Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1813; Conservative 0; Mismatches 24; Indels 4; Gaps 1; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 618 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 677 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 678 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 737 



Qy 

Db 



121 
738 



180 
797 



Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 798 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 857 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I II I I I I I I I I I I I I I II I I! I I I 

Db 858 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 917 

Qy 301 T CT AT T GAAGT CAT C ACCT CT CAAGAGAGGGAGGT GACAATTAAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 918 T CT AT T GAAGT CATCAC CT CT CAAGAGAGGGAG GT GACAATTAAGAAAC C CAATG GAGAA 977 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 978 AC CAG C ACAACC ACT ATT C GGGT CT GGAAT GAAAC T GT CT CCAAC CT GAC C CT T AT GGC C 1037 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1038 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 1097 

Qy 481 AT T G CT GGT GAT CT GG GAC CTT CT AC CAT T GT AGG GAGT GC AG C CT T CAACAT GT T CAT C 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1098 AT T GCT GGT GAT CT GG GAC CTT CT AC CAT T GT AGG GAGT GCAG CCT T CAACAT GTT CAT C 1157 

Qy 541 AT CAT T GGC AT CT GT GT CT AC GT GAT C C C AGAC G GAGAGACT C G C AAGAT C AAG C AT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1158 AT CAT T GGC AT CT GT GT CT ACGT GAT C C C AGAC GGAGAGACT C GCAAGAT CAAGCAT CT A 1217 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II 

Db 1218 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1277 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1278 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1337 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1338 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1397 

Qy 781 AT GCACAAAAAGTAC CGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1398 AT GCACAAAAAGTAC C GCACAGACAAACAC C GAGGAATT ATC ATAGAGACAGAGGGT GAC 1457 

Qy 841 CACCCTAAGGGCATTGAGATGGATGGGAAAATGATGAATTCCCATTTTCTAGATGGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1458 CACCCTAAGGGCATT GAGAT GGATGGGAAAAT GATGAATT CCCATTTTCTAGAT GGGAAC 1517 

Qy 901 CTGGT GCCCCTGGAAGGGAAGGAAGTGGAT GAGTCCCGCAGAGAGAT GAT CCGGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1518 CT G GT GC CC CT GGAAGGGAAGGAAGT GGAT GAGT C C C GCAGAGAGAT GAT CC GGAT T CT C 1577 

Qy 961 AAGGAT CTGAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCTGGT GGAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I 
Db 1578 AAG GAT CT GAAGCAAAAAC AC C CAGAGAAGGACT T AGAT CAGC T GGT GGAGAT G GC CAAT 1637 



Qy 



1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1638 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1697 



Qy 1081 AT GAT GACT GGT GCAGG CAAT AT C CT GAAGAAACAT GCAGC AGAACAAGC CAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1698 AT GAT GACT GGT GC AGGCAAT AT C CT GAAGAAACAT GC AGCAGAACAAGC CAAGAAGG C C 1757 

Qy 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 1758 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1817 

Qy 12 01 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I II I 
Db 1818 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1877 

Qy 1261 AAAG GG GGAGACAT GT CAAAGAC CAT GT AT GTG GACT ACAAAACAGAGGAT GGT TCT GC C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 187 8 AAAGGGGGAGAC AT GT CAAAGAC CAT GT AT GT G GACT ACAAAACAGAGGAT G GT T CT GC C 1937 

Qy 1321 AAT GCAGGGGCT GACT AT GAGT T C ACAGAGGGCAC G GT GGT T CT GAAGCCAGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1938 AAT GCAGGGGCT GACT AT GAGT T CACAGAGGGCAC GGT GGT T CT GAAGC CAG GAGAGAC C 1997 

Qy 1381 CAGAAGGAGTT CTCCGT GGGCATAATTGAT GACGACATTTTT GAGGAGGATGAACACTTC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1998 CAGAAGGAGTT CTCCGT GGGCATAATT GAT GACGACATTTTT GAGGAGGATGAACACTT C 2057 

Qy 1441 T TT GTAAGGTTGAGCAAT GT CCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2058 T TT GT AAGGTT GAGCAAT GT C C GCAT AGAGGAGGAGC AGC C AGAGGAGGGGAT GC CT C C A 2117 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2118 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 2177 

Qy 1561 GTTACC AT CT T GGAT GAT GACCAT GC AG GCAT CT T CACTT T T GAAT GT GAT ACT ATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2178 GTTACCAT CT T GGAT GAT GAC CAT G CAGGCAT CTT CACTT T T GAAT GT GATACTATT CAT 2237 

Qy 1621 GT CAGT GAGAGT AT T GGT GT TAT GGAGGT CAAGGT T CT GCG GAC AT C AGGT G C C C GGGGT 1680 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 2238 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 2297 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2298 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 2357 

Qy 1741 GAAGAC ACAT AT GGGGAGT T GGAAT T CAAGAAT GAT GAAACT GT AT GT GACAGACAGGAA 1800 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 2358 GAAGAC AC AT AT G GGGAGT T GGAAT T CAAGAAT GAT GAAAC T GT GAAAAC C AT AAG 2413 

Qy 1801 GCT GACT AT GGAAGAAGAG GAG GC CAAGAGGATAGCAGAGA 1841 

III I I I I I I I I I I I II I I I I I I I 

Db 2414 GGT T AAAAT AGT AGAT GAG GAG GAAT AC GAAAGGCAAGAGA 2454 



RESULT 4 



US-10-256-537-1 

Sequence 1, Application US/10256537 
Publication No. US20030162 196A1 
GENERAL INFORMATION: 
APPLICANT: Carroll, Joseph M. 

TITLE OF INVENTION: METHODS OF USING 69039, A NOVEL HUMAN 
TITLE OF INVENTION: NA/CA EXCHANGER FAMILY MEMBER 
FILE REFERENCE: MPI01-231P1RM 
CURRENT APPLICATION NUMBER: US/ 10/256, 537 
CURRENT FILING DATE: 2002-04-19 
PRIOR APPLICATION NUMBER: 60/325,737 
PRIOR FILING DATE: 2001-09-28 
NUMBER OF SEQ ID NOS : 5 

SOFTWARE: FastSEQ for Windows Version 4.0 
SEQ ID NO 1 
LENGTH: 2534 
TYPE: DNA 

ORGANISM: Homo sapien 
US-10-256-537-1 

Query Match 95.8%; Score 1784.4; DB 15; Length 2534; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1785; Conservative 0; Mismatches 1; Indels 0; Gaps 0 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 343 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 402 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 03 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 462 

Qy 121 AC AGGGCAGAACAAT GAGT C CT GTT C AGGGTCAT C GGACT G CAAGGAGGGT GT CAT C CT G 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 463 ACAGGGCAGAACAATGAGT CCTGTTC AGGGTCAT CGGACTGCAAGGAGGGT GT CAT CCTG 522 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 523 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 582 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 583 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 642 

Qy 301 T CT ATT GAAGT CAT CAC CT CT CAAGAGAG GGAGGT GACAAT T AAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 643 T CT ATT GAAGT CAT CAC CT CTCAAGAG AG G GAGGT GACAAT TAAGAAAC C CAAT GGAGAA 702 

Qy 361 AC C AGC ACAAC CAC TAT T C GGGT CT GGAAT GAAACT GT CT C CAACCT GAC C CT T AT GGCC 420 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 03 AC CAGC ACAAC CACT AT TC G GGT CT GGAAT GAAACT GT CT C CAACCT GAC CCT TAT GGCC 762 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 63 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 822 



Qy 



481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 



Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 



823 



541 



883 



I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II II I I I I 

ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 



882 



600 



AT CAT T G G C AT CT GT GT CT AC GT GAT C C C AGAC GGAGAGACT C G CAAGAT CAAGC AT C T A 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ATCATT GGCAT CT GT GT CT ACGT GAT CCCAGAC GGAGAGACT CGCAAGAT CAAGCAT CTA 942 



660 



601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I | | | | | 

943 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1002 



661 



720 



CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 
I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
1003 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1062 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I 

1063 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1122 

781 AT G CACAAAAAGT AC C GCAC AGACAAACAC C GAGGAATTAT CAT AGAGACAGAGGGT GAC 840 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

1123 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 1182 

841 CACCCTAAGGGCATTGAGATGGATGGGAAAATGATGAATTCCCATTTTCTAGATGGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1183 C AC C CTAAGG GCATT GAGAT GGAT GGGAAAAT GAT GAATT C C CAT T T T CT AGAT GGGAAC 1242 

901 CT GGT GC CCCTGGAAGGGAAG GAAGT GGAT GAGT C CC GCAGAGAGAT GAT C C GGATT CT C 960 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
1243 CTGGTGCCCCT GGAAGGGAAGGAAGT G GAT GAGT CC C GCAGAGAGAT GAT C CGGATT CTC 1302 

961 AAGGAT CTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCT GGT GGAGAT GGCCAAT 1020 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1303 AAGGAT CTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCT GGT GGAGATGGCCAAT 1362 

1021 TACT AT GCTCTTTCC CAC CAACAGAAGAG CCGCGCCTT CT AC C GT AT C CAAGC C ACT C GT 1080 

I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
1363 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1422 

1081 AT GAT GAC T GGT GCAGGCAAT ATC CT GAAGAAAC AT GCAGCAGAACAAGC CAAGAAGGCC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I II I I I I I I I I 

1423 AT GAT GACTGGT GC AGG CAAT AT C CT GAAGAAAC AT GCAGCAGAACAAGC CAAGAAG GC C 14 82 

1141 T CCAGC AT GAGCGAGGT GCAC AC C GAT GAGC CT GAG GACT T TAT T T C CAAG GT CT T CT TT 1200 

I I I I I I I I I I I M I I I I I I I I I I I I II I I I I II I I I I I I I I 

1483 T CCAGC AT GAGCGAGGT GCAC AC C GAT GAGC CT GAGGACTT T AT T T C CAAGGT CTT CT TT 1542 

1201 GAC C CAT GTT CTT ACCAGT G C CT G GAGAACT GT G GGGCT GT ACT C CT GAC AGT GGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1543 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1602 

1261 AAAGGG GGAGACAT GT CAAAGACCAT GT ATGT GGACT ACAAAACAGAG GAT GGTT CT GC C 1320 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1603 AAAGG G G GAGACAT GT CAAAGAC CAT GT AT GT G GACT ACAAAAC AGAGGAT GGT T CT G CC 1662 

1321 AAT GC AGGGGCT GACT AT GAGTT CAC AGAGGGCAC G GT GGT T CT GAAGCC AGGAGAGACC 1380 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 



Db 1663 AATGCAGGGGCT GACTAT GAGTT CACAGAGGGCACGGT GGTT CTGAAGCCAGGAGAGAC C 1722 

Qy 1381 C AG AAG G AGT TCTCCGTGGG C AT AAT T GAT G AC GAC AT T T T T GAG GAG GAT GAAC AC T T C 14 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1723 C AGAAGGAGTT CT C C GT GGGCAT AAT T GAT GAC GACAT T T TT GAGGAGGAT GAAC ACTT C 1782 

Qy 1441 TTT GTAAGGTT GAGCAATGT C CGCATAGAGGAGGAGCAGCCAGAGGAGGGGAT GC CTCCA 1500 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 17 83 TTT GTAAGGTT GAGCAAT GT CC G CAT AGAGGAG GAG CAGC CAGAGGAG GGGAT GC CT C C A 1842 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | 
Db 1843 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1902 

Qy 1561 GT T ACC AT CTT GGAT GAT GAC CAT GC AGGCAT CTT CACTT TT GAAT GT GAT AC TAT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | 
Db 1903 GT T AC CAT C T T GGAT GAT GAC CAT GC AG G CAT CTT CACT T TT GAAT GT GAT ACT AT T CAT 1962 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

M I I I I I I I I I I I I I I I I I I I I I I | I | | | | | | | | | | | | | | | | | | | | | | M I I I I I I I I I I 
Db 1963 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 2022 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I M I I I M M I M I I I I I I I I I I I II I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2 023 AC AGT CAT C GT CC C CT T TAG GAC AGT AGAAGGGACAG CCAAG GGT G GC GGT GAGGACTTT 2082 

Qy 1741 GAAGACACATATGGGGAGTT GGAATTCAAGAAT GAT GAAACTGTAT 178 6 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 0 83 GAAGAC ACAT AT GGGGAGTT G GAATT CAAGAAT GAT GAAACT GT GT 2128 



RESULT 5 
US-10-256-537-3 

; Sequence 3, Application US/10256537 
; Publication No. US20030162196A1 
; GENERAL INFORMATION: 
; APPLICANT: Carroll, Joseph M. 

; TITLE OF INVENTION: METHODS OF USING 69039, A NOVEL HUMAN 

; TITLE OF INVENTION: NA/CA EXCHANGER FAMILY MEMBER 

; FILE REFERENCE: MPI01-231P1RM 

; CURRENT APPLICATION NUMBER: US/ 10/256, 537 

; CURRENT FILING DATE: 2002-04-19 

; PRIOR APPLICATION NUMBER: 60/325,737 

; PRIOR FILING DATE: 2001-09-28 

; NUMBER OF SEQ ID NOS : 5 

; SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 3 
; LENGTH: 2534 
TYPE: DNA 

ORGANISM: Homo sapien 
FEATURE: 
NAME/KEY: CDS 
LOCATION: (343) ... (2130) 
US-10-256-537-3 



Query Match 95.8%; Score 1784.4; DB 15; Length 2534; 

Best Local Similarity 99.9%; Pred. No. 0; 



Matches 1785; Conservative 0; Mismatches 1; Indels 



0; Gaps 



0; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I 1 II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 343 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 4 02 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 403 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 462 

Qy 121 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGT CAT CGGACT GCAAGGAGGGTGT CAT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 463 AC AGG GCAGAACAAT GAGT CCT GTT C AG GGT CAT C GGACT GCAAG GAGG GT GT CAT CCT G 522 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 523 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 582 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 583 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 642 

Qy 301 T C T ATT GAAGT CAT CAC CT C T CAAGAGAGGGAGGT GACAATTAAGAAAC C CAAT G GAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 643 T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAATTAAGAAAC C CAAT GGAGAA 702 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | 
Db 703 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 762 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 763 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 822 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 54 0 

M I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I | | | | | M I I I II I I I I I I I I I I I 
Db 823 AT T GCT GGT GAT CT GGGAC CTT CTAC CAT T GT AGGGAGT GCAGC CT T CAACAT GTT CAT C 882 

Qy 541 AT C ATT G GC AT CT GT GT CTAC GT GAT C CCAGAC GGAGAGACTC GCAAGAT CAAG CAT CTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 883 ATCATT GGCAT CT GT GT CT ACGT GAT C C CAGAC GGAGAGACT C G CAAGAT CAAGCAT CTA 942 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 943 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1002 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | M I I I I I II I I I I I I I I I I 
Db 1003 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1062 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATA7\ACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | 
Db 1063 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1122 

Qy 781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGG7^TTATCATAGAGACAGAGGGTGAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1123 ATGCACAAAAAGT AC C GCACAGACAAACAC C GAG GAAT TAT CAT AGAGAC AGAG GGT GAC 1182 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



841 C ACCCT AAGGGC AT T GAGAT G GAT GG GAAAAT GAT GAAT T C C CAT T TT CTAGAT GGGAAC 900 
I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1183 C ACCCT AAGGGCAT T GAGAT GGAT GG GAAAAT GAT GAAT T C C CAT T TT CTAGAT GGGAAC 1242 

901 CTGGTGCCCCT GGAAGGGAAGGAAGT GGAT GAGT C CCGC AGAGAGAT GAT C C GGAT T CT C 960 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1243 CT GGT GC C C CT GGAAGGGAAGGAAGT GGAT GAGT C CCGCAGAGAGAT GAT C C GGAT T CT C 1302 

961 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

1303 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCT GGT GGAGAT GGCCAAT 1362 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 



1363 



1422 



1081 AT GAT GACTGGT GCAGGCAATATCCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1423 AT GAT GACTGGT GCAGGCAATATCCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 14 82 

1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 12 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1483 T CCAGCAT GAGC GAGGTGCACACCGATGAGCCT GAGGACTTTATTT CCAAGGTCTT CTTT 1542 

1201 GAC C CAT GTT CT T AC C AGT GC CT GGAGAAC TGTGGGGCT GT ACT C CT GAC AGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
1543 GACCCAT GTT CT T AC CAGT GC CTGGAGAACTGT GG G GCT GT ACT C CT GACAGT GGT GAGG 1602 

1261 AAAGGG G GAGAC AT GT CAAAGACCAT GT AT GT G GACT ACAAAACAGAGGAT GGTTCTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1603 AAAGGGGGAGACATGT CAAAGACCAT GTATGT GGACTACAAAACAGAGGATGGTT CTGCC 1662 

1321 AATGCAGGGGCT GACTAT GAGTTCACAGAGGGCAC GGTGGTT CTGAAGCCAGGAGAGACC 1380 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAT GC AGGG GCT GACTAT GAGT T CACAGAGGGC AC GGT G GTT CT GAAGC CAGGAGAGACC 



1663 



1722 



1381 C AGAAGGAGTT CT CC GT GGGCATAAT T GAT GAC GACATT T TT GAGGAGGAT GAACACT T C 14 40 

I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1723 CAGAAGGAGTTCTCCGTGGGCATAATTGATGACGACATTTTTGAGGAGGATGAACACTTC 1782 

1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
1783 T T T GTAAG GTT GAG CAAT GTCC GCATAGAGGAGGAGCAGCCAGAGGAGGGGAT GC CT C C A 1842 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1843 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1902 

1561 GT TAC CAT CTTG GAT GAT GAC C AT GCAGGCAT CTT C ACT TTT GAAT GT GAT ACTATT CAT 1620 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
1903 GTTACCAT CTT GGAT GAT GAC CATGCAGGCAT CTT CACTTTTGAAT GT GATACTATTCAT 1962 

1621 GT CAGT GAGAGT AT T GGT GT TAT GGAG GT CAAG GT T CT G C GGAC AT C AG GTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1963 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 2 022 



Qy 



1681 



ACAGT CAT C GT C C C CTT T AGGAC AGTAGAAGGGACAG C CAAGGGT GG C GGT GAG GACT T T 1740 




Db 



2023 



ACAGT CAT CGT C CC CT T T AGGACAGTAGAAG GGACAGC CAAG GGT GGC GGT GAG GACT T T 2 082 



Qy 



Db 



2083 



1741 



GAAGACACATAT GG G GAGT TGGAAT T CAAGAAT GAT GAAAC T GT AT 1786 
I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAAGACAC AT AT GG G GAGT TGGAAT T CAAGAAT GAT GAAACT GT GT 2128 



RESULT 6 
US-10-275-116-1 

; Sequence 1, Application US/10275116 
; Publication No. US20030096312A1 
; GENERAL INFORMATION: 
; APPLICANT: Merck Patent GmbH 

; TITLE OF INVENTION: No. US20030096312Alel natrium-calium exchanger protein 
; FILE REFERENCE: HNCX3CWWS 

; CURRENT APPLICATION NUMBER: US/10/275, 116 

; CURRENT FILING DATE: 2002-11-01 

; NUMBER OF SEQ ID NOS : 2 

; SOFTWARE: Patentln Ver. 2.1 

; SEQ ID NO 1 

LENGTH: 2781 
; TYPE: DNA 
; ORGANISM: Homo sapiens 

FEATURE: 

NAME/ KEY: CDS 

LOCATION: (1) . . (2781) 
US-10-275-116-1 

Query Match 95.7%; Score 1783; DB 15; Length 2781; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 1812; Conservative 0; Mismatches 25; Indels 4; Gaps 1; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 ACAGGGCAGAACAAT GAGTCCT GT T CAGGGT CAT CGGACT GCAAGGAGGGT GT CAT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 ACAGGGCAGAACAAT GAGT C CT GT T CAG GGT CAT C GGACT GCAAGGAG G GT GTC AT C CT G 180 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 



Qy 301 
Db 301 



T CT AT T GAAGT CAT CACCT CT CAAGAGAGGGAG GT GACAAT TAAGAAAC C CAAT G GAGAA 360 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT TAAGAAAC C CAAT GGAGAA 360 



Qy 


361 


Db 


361 


Qy 


421 


Db 


421 


Qy 


481 


Db 


481 


Qy 


541 


Db 


541 


Qy 


601 


Db 


601 


Qy 


661 


Db 


661 


Qy 


721 


Db 


721 


Qy 


781 


Db 


781 


Qy 


841 


Db 


841 


Qy 


901 


Db 


901 


Qy 


961 


Db 


961 


Qy 


1021 


Db 


1021 


yy 


1081 


Db 


1081 


Qy 


1141 


Db 


1141 



ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

AC C AGCACAAC CAC TAT T C GGGT CT GGAAT GAAACT GT CT C CAAC CT GACC CTT AT GGC C 420 

CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 48 0 

I 1 1 1 I I I 1 1 I I I 1 1 I 1 1 1 1 1 I 1 1 1 1 I I 1 1 1 I I I I I i 1 1 1 I I I 1 1 1 1 I I 1 1 I 1 1 I I I I I I I 

CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

AT T GCT G GT GAT CT G GGACCT T CT AC C ATT GT AGG GAGT GC AGC CTTCAACAT GT T CAT C 540 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I 

ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

AT CATT GGCAT CT GT GT CT ACGT GAT CCCAGACGGAGAGACT CGCAAGAT CAAGCAT CT A 600 

M I I I I II I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AT CAT T GGCAT CT GT GT CT AC GT GAT C C CAGAC GGAGAGACT CGCAAGAT CAAGC AT CT A 600 

C GAGT CTTCT T CAT CAC C GCT GCT T GGAGTAT CT TT GC CT ACAT CT GGCT CTAT AT GATT 660 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

T TT C CAGT GT GT GT C CTT CT GGCCTGGGTGG C AGAT AAAC GACT GCT C T T CT AC AAAT AC 780 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATA7\ACGACTGCTCTTCTACA7UVTAC 780 

AT GC AC AAAAAGT AC C G C AC AGAC AAAC AC C GAG GAAT TAT CAT AG AGAC AGAG G GT GAC 84 0 
I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 
AT GCAC AAAAAGT AC C GC AC AGACAAACAC C GAGGAATT AT CAT AGAGAC AGAG GGT GAC 840 

CAC C CT AAGG GC AT T GAGAT G GAT GGGAAAAT GAT GAAT T C C CAT T TT CT AGAT G GGAAC 900 

I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

CAC C CTAAGGG CATT GAGAT GGAT GG GAAAAT GAT GAAT T C CCATTT T CT AGAT GGGAAC 900 

CTGGTGCCCCTG GAAGGGAAGGAAGT G GAT GAGT CC C GCAGAGAGAT GAT C CGGAT T CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CT GGT GC CC CT GGAAG GGAAGGAAGT G GAT GAGT CC C GCAGAGAGAT GAT C CGGAT T CT C 960 

AAG GAT CT GAAGCAAAAACACCCAGAGAAG GACT T AGAT C AGCT GGT GG AGAT GGC CAAT 1020 
I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAGGAT CTGAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCTGGT GGAGAT GGCCAAT 1020 

TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TACT AT GCT CTT T CC CAC CAACAGAAGAGC C GT GC CT T CT AC C GT AT CC AAG C CACT C GT 1080 

AT GAT GACT GGT GCAGGCAATATCCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

AT GAT GACT GGT G CAGGC AAT AT C CT GAAGAAACAT GC AGCAGAACAAGC CAAGAAGGC C 1140 

T CCAGCAT GAGC GAGGT GCACACCGAT GAGCCT GAGGACTTTATTT CCAAGGT CTT CTTT 1200 

I | | I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 12 00 



Qy 

Db 



1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1201 GACCCAT GTT CTTACCAGT GC CT GGAGAACT GT GGGGCTGTACT CCT GACAGT GGTGAGG 1260 



Qy 


1261 


Db 


1261 


Qy 


1321 


Db 


1321 


Qy 


1381 


Db 


1381 


Qy 


1441 


Db 


1441 


Qy 


1501 


Db 


1501 


Qy 


1561 


Db 


1561 


Qy 


1621 


Db 


1621 


Qy 


1681 


Db 


1681 


Qy 


1741 


Db 


1741 


Qy 


1801 


Db 


1797 



AAAGGGGGAGACAT GTCAAAGACCATGTAT GTGGACTACAAAACAGAGGATGGTTCTGCC 132 0 
| | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAAGGGGGAGACAT GT CAAAGACCAT GTAT GTGGACTACAAAACAGAGGAT GGTTCT GCC 1320 

AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I 

AAT GCAGGG GCT GACT AT GAGTT CAC AGAGGGC AC G GT GGT T CT GAAGCCAG GAGAGAC C 1380 

C AG AAG G AGT TCTCCGTGGG C AT AAT T GAT G AC G AC AT T T T T GAG GAG GAT G AAC AC T T C 1440 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAGAAGGAGTTCT CCGT GGGCATAATT GAT GACGACATTTTTGAGGAGGAT GAACACTTC 144 0 

TTT GTAAGGTTGAGCAATGT CCGCAT AGAGGAGGAGCAGCCAGAGGAGGGGAT GCCT CCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTT GTAAGGTTGAGCAATGT CC GCAT AGAGGAGGAGCAGCCAGAGGAGGGGAT GCCT CCA 1500 

GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

GT T AC CAT CT T GGAT GATGACC AT GC AGGCAT CTT C ACT TTT GAAT GT GAT ACT AT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I Ml 

GTTACCAT CTT GGAT GAT GACCATGCAGGCATCTTCACTTTT GAAT GT GAT ACT ATT CAT 1620 

GT CAGT GAGAGT ATT G GT GT TAT GGAG GT CAAGGT T CT GC GGACAT CAGGT GCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

ACAGT CAT C GT C C CCTTT AGGAC AGT AGAAGGGACAGC CAAGG GT GGCGGT GAGGACTT T 1740 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I 
ACAGT CAT C GT C C CCT TTAGGACAGT AGAAGGGACAGC CAAGGGT GG C G GT GAGGACTT T 17 40 

GAAGACACATAT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GTAT GTGACAGACAGGAA 18 00 
I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAAGACACATAT GGGGAGT T GGAATT CAAGAAT GAT GAAAC T GT GAAAAC CAT AAG 17 96 

GCT GAC TAT GGAAGAAGAGGAGGCCAAGAGGAT AGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 

G GT TAAAAT AGT AGAT GAGGAG GAAT AC GAAAGGCAAGAGA 1837 



RESULT 7 

US-09-804-474A-1 

Sequence 1, Application US/09804474A 
Patent No. US20020119518A1 
GENERAL INFORMATION: 
APPLICANT: KODET, Stefan et al 

TITLE OF INVENTION: ISOLATED HUMAN TRANSPORTER PROTEINS, 

TITLE OF INVENTION: NUCLEIC ACID MOLECULES ENCODING HUMAN TRANSPORTER 
PROTEINS, 

TITLE OF INVENTION: AND USES THEREOF 
FILE REFERENCE: CL000891 

CURRENT APPLICATION NUMBER: US/ 09/ 804 , 474A 



; CURRENT FILING DATE: 2 001-03 
; NUMBER OF SEQ ID NOS : 4 
; SOFTWARE: FastSEQ for Windows 
; SEQ ID NO 1 

LENGTH: 2782 
TYPE: DNA 
; ORGANISM: Human 
US-09-804-474A-1 

Query Match 95.7%; Score 1783; DB 9; Length 2782; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 1812; Conservative 0; Mismatches 25; Indels 4; Gaps 1; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 10 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 69 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 70 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 129 

Qy 121 ACAGGGC AGAACAAT GAGT C CTGT T CAGGGT CAT C GGACT G CAAG GAGGGT GT CAT CC T G 180 

I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 130 AC AG GGC AGAACAAT GAGTC CT GT T CAGGGT CAT C GGACT GCAAG GAG GGT GT CAT C CT G 189 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

I I I I I I I I I I | | | I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 190 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 249 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 250 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 309 

Qy 301 T CTATTGAAGTCATCACCTCT CAAGAGAGGGAGGTGACAATTAAGAAACCCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 310 T CT AT T GAAGT CAT CACCT CT CAAGAGAG GGAGGT GACAAT TAAGAAAC C CAAT GGAGAA 369 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 370 AC C AGC ACAACCACTAT T CGGGT CTGGAAT GAAACT GT CT C CAAC CT GAC C CT T AT GGCC 429 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 30 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 489 

Qy 4 81 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 490 ATT GCT GGT GAT CT GG GAC CT T CT AC CATT GT AGGGAGT G CAGC CTT CAACAT GT T CATC 549 

Qy 541 AT C ATT GGCAT CT GT GT CT ACGT GAT C CCAGAC GGAGAGACT C GCAAGAT CAAG CAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 550 AT CATT GGC AT CT GT GT CT AC GT GAT C CCAGAC G GAGAGACT C GCAAGAT CAAGCAT CT A 609 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 610 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 669 



-13 
Version 4.0 



Qv 


661 


CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 


720 




| | || | | | | I I I I I 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 11 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


670 


CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAbbLCl LOl LAL1L1L1 1U1 1L 


79 Q 


Qv 


721 


TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 


780 




| | | | | | | | | | | | | | | | | | I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 




Db 


730 


TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGAT7\AACGACTGCTCTTCTACA7^ATAC 


/ o y 


Ov 


781 


AT G C AC AAAAAGT AC C G C AC AG AC AAAC AC C GAG G AAT TAT CAT AG AG AC AG AG G G T G AC 


840 




| | | | | | | | | I I | | | I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


790 


ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 




Qy 


841 


CAC C CTAAGGGCAT T GAGAT GGAT GGGAAAAT GAT GAAT T CCC ATT T TCT AGAT GGGAAC 


y uu 




I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


850 


CACCCTAAGGGCATTGAGATGGATGGGj^AAATGATGAATTCCCATTTTCTAGATGGGAAC 


a a n 

y(Jy 


Ov 


901 


CT GGT GCCCCTGGAAGGGAAGGAAGT GGAT GAGT CC CGCAGAGAGAT GAT CCGGATT CT C 


960 


Db 


910 


| | I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CT GGT GC CC C T GGAAGGGAAGGAAGT GGAT GAGT C C C GCAGAGAGAT GAT CC GGAT CCT C 


969 


Ov 


961 


AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGATGGCCAAT 


1020 




| | | | I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


970 


AAGGAT CT GAAGCAAAAAC ACC CAGAGAAG GACT T AGAT CAGCT G GT G GAGAT GGC CAAT 


1029 


Ov 


1021 


TACT AT GCTCTTTCC CAC C AAC AGAAGAG CCGCGCCT T CT AC C GT AT C CAAG C C ACT C GT 


1080 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 IN 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1030 


T AC TAT GCT CTT T CC C AC CAAC AGAAGAGC CG C GC CT T CT AC C GT AT C CAAGC CACT CGT 


1089 


Ov 


1081 


AT GAT GACT GGT GCAGGCAAT AT CCT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGCC 


1140 




1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 




Db 


1090 


AT GAT GACT GGTGCAGGCAATAT CCT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGCC 


1149 


Ov 


1141 


TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 


1200 




| I I I I I 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1150 


T C C AG CAT GAGC GAGGT GC ACAC C GAT GAGC CT GAG GACT TT ATT T CCAAGGT CT T CTT T 


1 A A A 

1209 


Ov 


1201 


GAC C CAT GT T CT T AC C AGT G C CT GGAGAACT GT GGGGCT GT ACT C CT GAC AGT GGT GAGG 


1260 




I M 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 




Db 


1210 


GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 


1269 


Ov 


1261 


AAAGG GGGAGAC AT GT CAAAGACCAT GT AT GT GGACT ACAAAACAGAGGAT GGTT CT G C C 


1320 




I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1270 


AAAGGGGGAGACAT GT CAAAGACCAT GT AT GT GGACTACAAAAC AGAGGAT GGTTCTGCC 


1 o o o 

1329 


Ov 


1321 


AATGCAGGGGCTGACTAT GAGT TCACAGAGGGCAC GGT GGTT CTGAAGCCAGGAGAGACC 


1380 




I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1330 


AAT GCAGG GGCT GACT AT GAGT T C ACAGAGGGCAC GGT GGT T CT GAAG C CAGGAGAGAC C 




Qv 


1381 


CAGAAGGAGTTCTCCGTGGGCATAATTGATGACGACATTTTTGAGGAGGATGAACACTTC 


1440 




I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1390 


CAGAAGGAGT T CT C C GT GGGCATAAT T GAT GAC GAC AT T TT T GAGGAGGAT GAACACT T C 


1 A A Q 

144 y 


Qy 


1441 


T TT GT AAGGT T GAGCAAT GT C CGCAT AGAGGAGGAGCAGCC AGAGGAGGGGAT GC CT C C A 


1500 




II II II II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1450 


T TT GT AAGGT T GAGCAAT GT C CGCAT AGAGGAGGAGCAGC CAGAGGAG GG GAT GC CT C CA 


1509 


Qy 


1501 


GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 



Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1510 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1569 



QY 



Db 



1561 GTT ACC AT CT T GGAT GAT GAC CAT GC AGGCAT CT T CACTT T T GAAT GT GATACT ATT CAT 1620 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I > I I I I I 
1570 GTT AC CAT CT TGGAT GAT GAC CAT GC AGGCAT C T T CACT T T T GAAT GT GATACT AT T CAT 162 9 



Qy 



Db 



1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1630 GT C AGT GAGAGT AT T GGT GT TAT GGAG GT CAAGGTT CT G C GGACAT C AGGT GC C CGGGGT 1689 



Qy 



Db 



1681 AC AGT CAT CGTCCCCTT TAG GACAGT AGAAGG GACAGCCAAG GGT GGCGGT GAGGAC T TT 1740 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1690 AC AGT CAT C GTC C C CT T T AGGACAGT AGAAG GGACAGCCAAG G GT GGC G GT GAGGACTTT 1749 



Qy 



Db 



1741 GAAGACACAT ATGGGGAGTT GGAATT CAAGAAT GATGAAACT GT AT GT GACAGAC AGGAA 18 00 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I 

1750 GAAGACACAT AT GGGGAGTT GGAATT CAAGAAT GAT GAAAC T GT GAAAAC C AT AAG 1805 



Qy 



Db 



1801 GCT GACT AT GGAAGAAGAGGAGGC CAAGAGGAT AGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 

1806 GGT T AAAAT AGT AGAT GAGGAGGAAT ACGAAAG G CAAGAGA 1846 



RESULT 8 

US-09-804-474A-3 

; Sequence 3, Application US/09804474A 

; Patent No. US20020119518A1 

; GENERAL INFORMATION: 

; APPLICANT: KODET, Stefan et al 

; TITLE OF INVENTION: ISOLATED HUMAN TRANSPORTER PROTEINS, 

; TITLE OF INVENTION: NUCLEIC ACID MOLECULES ENCODING HUMAN TRANSPORTER 
PROTEINS, 

; TITLE OF INVENTION: AND USES THEREOF 
; FILE REFERENCE: CL000891 

; CURRENT APPLICATION NUMBER: US/09/804 , 474A 
; CURRENT FILING DATE: 2001-03-13 
; NUMBER OF SEQ ID NOS : 4 

; SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 3 

LENGTH: 126512 

TYPE : DNA 

ORGANISM: Human 
; FEATURE : 

; NAME /KEY: misc_f eature 

LOCATION: ( 1 )...( 126512 ) 

OTHER INFORMATION: n - A,T,C or G 
US-09-804-474A-3 

Query Match 95.7%; Score 1782.8; DB 9; Length 126512; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1784; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 2010 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 2069 



Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2070 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 2129 

Qy 121 AC AGGGC AGAAC AAT GAGT C C T GT T C AG G GT CAT C G GACT GC AAGGAGG GT GT CAT C CT G 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2130 ACAGGGCAGAACAATGAGTCCTGTTCAGGGTCAT CGGACT GCAAGGAGGGTGT CAT CCT G 2189 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2190 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 2249 

Qy 2 41 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I II I I I I I I I I II I I I I I I I I I I I I I I II I I I I I II I I I I I I II I I I I I I I I I I I I I 

Db 2250 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 2309 

Qy 301 T CTATT GAAGT CAT CAC CT CT CAAGAGAGG GAGGTGACAAT T AAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 2310 T CTATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GAC AAT T AAGAAAC C CAAT GGAGAA 2369 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2370 AC C AGC ACAACAACT AT T C G GGT C T GGAAT GAAACT GT CT C CAACCT GAC C CT TAT GGCC 2429 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2430 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 2489 

Qy 4 81 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 24 90 AT T GCT GGT GAT CT GGGAC CT T CTAC CAT T GT AG GGAGT GCAGC CT T CAACAT GTT C AT C 2549 

Qy 541 AT CAT T GGC AT CT GT GT CTAC GT GAT C C C AGAC G GAGAGACT C GC AAGAT C AAG CAT CT A 600 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2550 AT CATT GGC AT CT GT GT CTAC GT GAT CCC AGAC GGAGAGACT C GCAAGAT CAAG CAT CT A 2609 

Qy 601 CGAGT CT T CTT C AT CAC CGCTGCTTG GAGT AT CT T T G C CT ACAT CT GGCT C TAT AT GAT T 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 610 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 2669 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 2 670 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 2729 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATA7\ACGACTGCTCTTCTAC7\AATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2730 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 2789 

Qy 7 81 AT G C AC AAAAAGT AC C G C AC AGAC AAAC AC C GAG GAAT TAT CAT AG AGAC AGAG GGT GAC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2790 AT GCACAAAAAGTACCGCACAGACAAACACCGAGGAATTAT CATAGAGACAGAGGGT GAC 2849 

Qy 841 CACC CT AAGGGCATT GAGAT GGAT GGGAAAAT GATGAATT CCCATTTTCTAGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2850 CACCCTAAGGGCATTGAGATGGATGGGAAAATGATGAATTCCCATTTTCTAGATGGGAAC 2909 

Qy 901 CT G GT G CC C CT GGAAGGGAAG GAAGT G GAT GAGT CCC GCAGAGAGAT GAT CCGGAT T CT C 960 



Db 2910 C T GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGT CC C G C AGAGAGAT GAT C C GGAT T CT C 2969 

Qy 961 AAGGAT CT GAAG CAAAAAC ACCCAGAGAAGGACT T AGAT C AGCT G GT GGAGAT G G C CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 297 0 AAGGAT CT GAAG CAAAAACAC C CAGAGAAGGACT T AGAT C AGCT GGT G GAG AT GGC CAAT 3029 

Qy 1021 TACT AT GCTCTTTCC C AC CAAC AGAAG AGC C GC GC CT T CT AC C GT AT C C AAGC CAC T C GT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 3030 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 3089 

Qy 1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACATGCAGC AGAACAAGCCAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3090 AT GAT GACT GGT GCAG G CAAT AT C CT GAAGAAAC AT GCAG CAGAACAAGC CAAGAAGGC C 3149 

Qy 1141 T C CAGCAT GAGC GAGGT GC ACAC C GAT GAG CCT GAGGACT T TAT T T C CAAGGT CT T CT T T 12 00 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 3150 T C CAGCAT GAGC GAG GT GCAC AC C GAT GAGC CT GAGGACT T TAT T T C CAAGGTCTT CTT T 32 09 

Qy 12 01 GACCCAT GTTCTTAC CAGT GCCT GGAGAACT GT GGGGCT GTACT CCTGACAGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3210 GAC CC AT GT T CT TAC CAGT G C CT G GAGAACT GT G GGG CT GTACT C CT GACAGT GGT GAGG 32 69 

Qy 12 61 AAAGGGGGAGACAT GT CAAAGACCAT GTAT GT GGACTACAAAACAGAGGAT GGTT CTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 327 0 AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GT G GACT ACAAAAC AGAGGAT GGTTCTGCC 3329 

Qy 1321 AAT GCAGGGGCT GACTAT GAGTT CACAGAGGGCACGGT GGTTCT GAAGCCAGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3330 AATGCAGGGGCT GACTAT GAGTT CACAGAGGGCACGGT GGTT CT GAAGC CAGGAGAGACC 3389 

Qy 1381 CAGAAGGAGTTCT CCGT GGGCATAATTGAT GACGACATTTT T GAGGAGGATGAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3390 CAGAAGGAGTTCT CCGT GGGCATAATT GAT GACGACATTTTT GAGGAGGAT GAACACTT C 34 49 

Qy 1441 T T T GTAAGGTT GAGCAAT GT CCGCAT AGAGGAGGAGC AGC C AGAGGAGGGGAT GC CTC C A 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 3450 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 3509 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 3510 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 3569 

Qy 1561 GTTACCATCTTGGAT GAT GACCATGCAGGCAT CTT CACTTTT GAAT GT GATACT ATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3570 GT TAC CAT CT TG GAT GAT GAC CAT GC AGGC AT CTT CACT TT T GAAT GT GATACT AT T CAT 362 9 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 3630 GT CAGT GAGAGT ATT G GT GT TAT GGAGGT CAAGGT T CT GCG GACAT CAGGT GC CC G GGGT 3689 

Qy 1681 AC AGT CAT CGTCCCCTT TAGGACAGT AGAAG GGAC AGC C AAGGGT G GC GGT GAGGACT T T 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3690 AC AGT CAT CGTCCCCTT TAGGACAGT AGAAG GGAC AGC CAAGGGT GGC GGT GAGGACTT T 3749 

Qy 1741 GAAG AC AC AT AT GGG GAGT T G GAATT C AAGAAT GAT GAAAC T GTAT 1786 

I I I I I I I I I I I I I I I I I I I I i I I I I I I I I II I I I I I I I I I I I I I I 



Db 



3750 GAAGACACAT AT G G GGAGT T GGAATT CAAGAAT GAT GAAAC T GT GT 3795 
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APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
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NOVEL ANTIBODIES THAT BIND TO ANTIGENIC POLYPEPTIDES, 



APPLICANT 
TITLE OF INVENTION 
NUCLEIC ACIDS 

TITLE OF INVENTION: ENCODING THE ANTIGENS, AND METHODS OF USE 
FILE REFERENCE: 21402-322A 

CURRENT APPLICATION NUMBER: US/10/114 , 153 
CURRENT FILING DATE: 2002-08-06 
PRIOR APPLICATION NUMBER: 60/281086 
PRIOR FILING DATE: 2001-04-03 
PRIOR APPLICATION NUMBER: 60/281906 
PRIOR FILING DATE: 2001-04-05 
PRIOR APPLICATION NUMBER: 60/282020 
PRIOR FILING DATE: 2001-04-06 
PRIOR APPLICATION NUMBER: 60/282930 
PRIOR FILING DATE: 2001-04-10 
PRIOR APPLICATION NUMBER: 60/283512 
PRIOR FILING DATE: 2001-04-12 
PRIOR APPLICATION NUMBER: 60/283444 
PRIOR FILING DATE: 2001-04-12 
PRIOR APPLICATION NUMBER: 60/283657 
PRIOR FILING DATE: 2001-04-13 
PRIOR APPLICATION NUMBER: 60/283710 



PRIOR FILING DATE: 2001-04-13 
PRIOR APPLICATION NUMBER: 60/283678 
PRIOR FILING DATE: 2001-04-13 
PRIOR APPLICATION NUMBER: 60/284234 
PRIOR FILING DATE: 2001-04-17 

Prior Application data removed - See File Wrapper or PALM. 
NUMBER OF SEQ ID NOS: 2 51 
SEQ ID NO 1 
LENGTH: 2 813 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE : 
NAME/ KEY: CDS 
LOCATION: (9) . . (2793) 
US-10-114-153-1 

Query Match 95.7%; Score 1782.4; DB 15; Length 2813; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1783; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II 
Db 9 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 68 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 69 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 12 8 

Qy 121 ACAG GGCAGAACAAT GAGT CCT GTT CAG GGT CAT C GGACT GCAAGGAG GGT GT CATC CT G 180 

I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 9 ACAGGGCAGAACAAT GAGT C CT GT T CAGGGT CAT C GGACT GCAAGGAGG GT GTC AT CCT G 188 

Qy 181 C C AAT CT GGT AC CC GGAGAAC C CT T CC CT T GGGGACAAGAT T GC CAGGGT CATT GT CT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 18 9 C CAAT CT GGT AC CC GGAGAAC C CTT CCCT T GGGGACAAGAT T GC CAGGGT CAT T GT CT AT 248 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 9 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 308 

Qy 301 T CT AT T GAAGT CAT CACCT CT CAAGAGAGGGAG GT GACAAT TAAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 309 T CTATTGAAGT CAT CACCT CT CAAGAGAGGGAGGTGACAATTAAGAAACCCAAT GGAGAA 368 

Qy 361 ACCAGCACAAC CACT ATT C GGGT CT GGAAT GAAACT GT CT C CAAC CT GACC CTT AT G GC C 420 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 369 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 42 8 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I II II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 42 9 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 488 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 4 89 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 548 



Qy 



541 AT CAT T G G CAT CT GT GT CTAC GT GATC C CAGAC G GAGAGACT CGCAAGAT CAAGCAT CT A 600 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 549 AT CATT GG C AT CT GT GT CT ACGT GAT CCC AGAC GGAGAGACT C GCAAGAT CAAGC AT CT A 608 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II 1 I I I I I I I I I 1 I II I I I I 

Db 609 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 668 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 669 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 728 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 729 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 788 

Qy 781 AT GC AC AAAAAGT AC C G C AC AGAC AAACAC C GAGGAAT TAT C AT AGAGAC AGAGG GT GAC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 789 AT GCACAAAAAGTACC GCACAGACAAACACCGAGGAATT ATCATAGAGACAGAGGGT GAC 848 

Qy 841 CACCCTAAGGGCATTGAGATGGATGGGAAAATGATGAATTCCCATTTTCTAGATGGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 84 9 CAC CCTAAGGGCATT GAGAT G GAT GGGAAAAT GAT GAAT T CC CAT T T T CT AGAT GG GAAC 908 

Qy 901 CTGGTGCCCCTG GAAGGGAAGGAAGT G GAT GAGT CC CGC AGAGAGAT GAT CC G GATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 909 CT GGT G CCC CT G GAAGGGAAGGAAGT GGAT GAGT C C C GC AGAGAGAT GAT CC GGAT T CT C 968 

Qy 961 AAGGAT CT GAAG CAAAAACACC CAGAGAAG GACT T AGAT CAGCT GGT GGAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 969 AAGGAT CT GAAGCAAAAACACC CAGAGAAG GACT T AGAT CAGCT GGT GGAGAT GGC CAAT 1028 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1029 TACTAT GCT CTTT CCCACCAACAGAAGAGC CGT GCCTTCTACCGTATCCAAGCCACT CGT 1088 

Qy 1081 AT GAT GACT GGTGCAGGCAATATCCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1089 AT GAT GACT GGTGCAGGCAATATCCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 114 8 

Qy 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 1149 TCCAGCATGAGCGAGGT GCACACCGAT GAGCCT GAGGACTTT ATTT CCAAGGT CTT CTTT 1208 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 12 60 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I II I I I I I I I I I I I I 
Db 1209 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1268 

Qy 1261 AAAGGG G GAGAC AT GT CAAAGAC CAT GTAT GT GGACTACAAAACAGAGGATG GTT CT GC C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1269 AAAGGGGGAGAC AT GT CAAAGAC CAT GTAT GT GGACT ACAAAAC AGAGGAT G GT T CT GC C 1328 

Qy 1321 AAT GCAGGG GCT GACT AT GAGT T CAC AGAGGGC AC GGT GGTT CT GAAGC C AGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1329 AAT GCAG G G GCT GACT AT GAGT T CAC AGAGGGCAC GGT GGTT CT GAAGC C AGGAGAGAC C 13 88 

Qy 1381 CAGAAGGAGTTCTCCGTGGGCATAATTGATGACGACATTTTTGAGGAGGATGAACACTTC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1389 CAGAAGGAGTT CTC CGT GGGCATAATTGAT GACGACATTTT TGAGGAGGAT GAACACTTC 144 8 

Qy 14 41 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 49 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1508 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1509 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1568 

Qy 1561 GT T AC CAT CT T GGAT GAT GAC CAT GC AGG CAT CT T C ACT T T T GAAT GT GAT ACT AT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1569 GTT ACCAT CT T GGAT GAT GAC CAT GCAGGCAT CT T CAC TTT T GAAT GT GAT ACT ATT CAT 1628 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1629 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1688 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1689 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1748 

Qy 1741 GAAGACACAT AT GG GGAGT T GGAAT T CAAGAAT GAT GAAACTGT 1784 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 174 9 GAAGACACAT AT G G GGAGTT GGAAT T CAAGAAT GAT GAAACT GT 17 92 
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GENERAL INFORMATION: 



APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 



Padigaru, Muralidhara 
Shenoy, Suresh 
Kekuda, Ramesh 
Rastelli, Luca 
Mezes, Peter 
Smithson, Glennda 
Guo, Xiaojia 
Gerlach, Valerie 
Casman, Stacie 
Boldog, Ferenc 
Li, Li 

Zerhusen, Bryan 
Tchernev, Velizar 
Gangolli, Esha 
Vernet, Corine 
Spytek, Kimberly 
Malyankar, Uriel 
Patturajan, Meera 
Miller, Charles 
Taupier, Raymond J. Jr. 
Heyes, Melvyn 
Ju, Jingfang 
Peyman, John 
Catterton, Elina 
MacDougall, John 



; APPLICANT: Edinger, Shlomit 
; APPLICANT: Stone, David 
; APPLICANT : Mazur, Ann 

; TITLE OF INVENTION: NOVEL ANTIBODIES THAT BIND TO ANTIGENIC POLYPEPTIDES, 
NUCLEIC ACIDS 

; TITLE OF INVENTION: ENCODING THE ANTIGENS, AND METHODS OF USE 

FILE REFERENCE: 21402-322A 
; CURRENT APPLICATION NUMBER: US/ 10/ 114 , 153 
; CURRENT FILING DATE: 2002-08-06 
; PRIOR APPLICATION NUMBER: 60/281086 
; PRIOR FILING DATE: 2001-04-03 

PRIOR APPLICATION NUMBER: 60/281906 
; PRIOR FILING DATE: 2001-04-05 
; PRIOR APPLICATION NUMBER: 60/282020 
; PRIOR FILING DATE: 2001-04-06 
; PRIOR APPLICATION NUMBER: 60/282930 
; PRIOR FILING DATE: 2001-04-10 
; PRIOR APPLICATION NUMBER: 60/283512 
; PRIOR FILING DATE: 2001-04-12 

PRIOR APPLICATION NUMBER: 60/283444 
; PRIOR FILING DATE: 2001-04-12 
; PRIOR APPLICATION NUMBER: 60/283657 

PRIOR FILING DATE: 2001-04-13 
; PRIOR APPLICATION NUMBER: 60/283710 
; PRIOR FILING DATE: 2001-04-13 
; PRIOR APPLICATION NUMBER: 60/283678 
; PRIOR FILING DATE: 2001-04-13 
; PRIOR APPLICATION NUMBER: 60/284234 
; PRIOR FILING DATE: 2001-04-17 

; Prior Application data removed - See File Wrapper or PALM. 

; NUMBER OF SEQ ID NOS : 251 

; SEQ ID NO 3 

; LENGTH: 284 0 

; TYPE: DNA 

ORGANISM: Homo sapiens 

FEATURE : 

NAME/ KEY: CDS 
; LOCATION: (63).. (2838) 
US-10-114-153-3 

Query Match 95.7%; Score 1782.4; DB 15; Length 2840; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1783; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 63 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 122 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 123 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 182 

Qy 121 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGT CATCGGACT GCAAGGAGGGT GT CATCCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 183 AC AGGG CAGAACAAT GAGT C CT GT T CAGG GT CAT C G GACT G C AAGGAGG GT GT CAT C CT G 242 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 



Db 24 3 C CAAT CT GGT ACC C G GAGAAC CCTT C C CTT GGGGACAAGAT T G C CAGGGT CAT T GT CTAT 302 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 303 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 362 

Qy 301 T CTATTGAAGT CAT CACCT CT CAAGAGAGGGAGGTGACAATTAAGAAACCCAAT GGAGAA 360 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I I 

Db 363 T CTAT T GAAGT CAT CAC CT CT CAAGAGAGGGAG GT GACAAT T AAGAAACC CAAT GGAGAA 422 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGA7KACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 423 ACCAGCACAAC CACTATT CGGGT CT GGAAT GAAACT GT CT C CAACCT GACCCTT AT GGCC 482 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 83 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 542 

Qy 481 ATT G CT GGT GAT CT GGGAC CT T CT ACC ATT GTAGGGAGT GC AGC CTT CAACAT GT T CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 54 3 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 602 

Qy 541 ATCATT GG CAT CT GT GT CT AC GT GAT C C C AGAC G GAGAGACT C G CAAGAT CAAG CAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 603 AT CATT GGCAT CT GT GT C T AC GT GAT C C CAGAC G GAGAGACT CG CAAGAT CAAG CAT CT A 662 

Qy 601 C GAGT CT T CTT CAT CAC C GCT GCT T GGAGT AT CTT T GC CTACAT CT GGCTCT AT AT GATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 663 C GAGT CT T CTT CAT CAC C GCT GCT T GGAGT AT CT T T GC CTACAT CT GGCT CT AT AT GATT 722 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 723 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 782 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 83 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 842 

Qy 781 ATGC ACAAAAAGT AC CGC ACAGACAAACAC C GAGGAAT TAT CAT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 8 43 AT GCACAAAAAGTACCGCACAGACAAACACCGAGGAATTAT CAT AGAGACAGAGGGT GAC 902 

Qy 841 CACCCTAAGGGCATT GAGAT GGAT GGGAAAATGAT GAATTCCCATTTT CTAGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I 

Db 903 CACCCTAAGGGCATT GAGAT GGATGGGAAAAT GAT GAATTCCCATTTT CTAGAT GGGAAC 962 

Qy 901 CTGGTGCCCCT GGAAGGGAAGGAAGTGGAT GAGT CCCGCAGAGAGAT GATCCGGATT CTC 960 

I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 963 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTCTC 1022 

Qy 961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGATGGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II 

Db 1023 AAGGAT CT GAAGCAAAAACAC C CAGAGAAGGACT T AGAT CAGCT GGT GGAGAT GGCCAAT 1082 



Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 



Db 1083 TACTATGCTCTTTCCCACCAACAGAAGAGCCGTGCCTTCTACCGTATCCAAGCCACTCGT 1142 

Qy 1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1143 AT GAT GACT GGT GCAGGCAAT AT CCT GAAGAAACAT GCAGC AGAACAAG C CAAGAAGGC C 1202 

Qy 1141 T C C AGC AT GAGC GAGGT GC AC AC C GAT GAG C CT GAG GACT T TAT T T C CAAGGT CT T CT T T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1203 TC CAGCATGAGCGAGGT GCACAC CGAT GAGCCT GAGGACTTTATTT C CAAGGT CTT CTTT 1262 

Qy 1201 GACC CAT GT T CTT ACC AGT GC CT GGAGAACT GT GGGGCT GT ACT CCT GACAGT GGT GAGG 1260 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1263 GAC CCAT GT T CTT ACCAGT GCCT GGAGAACT GT GGGGCT GT ACT CCT GACAGT GGT GAGG 1322 

Qy 1261 AAAGGGGGAGACAT GT CAAAGAC CAT GT AT GT GGACTACAAAACAGAGGAT GGTT CT GC C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 132 3 AAAGGGGGAGACAT GT CAAAGAC CAT GT AT GT GGACTACAAAACAGAGGAT GGT T CT GC C 13 82 

Qy 1321 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1383 AAT GC AGGG G CT GACT AT GAGT T C ACAGAG GG CAC GGTGGT T CT GAAGC CAGGAGAGAC C 1442 

Qy 1381 CAGAAGGAGTTCT CCGT GGGCATAATT GAT GACGACATTTTTGAGGAGGATGAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1443 CAGAAGGAGTTCT CCGT GGGCATAATT GAT GACGACATTTTTGAGGAGGATGAACACTT C 1502 

Qy 1441 TT T GT AAGGT T GAGCAAT GT CC G C ATAGAG GAGGAGCAGCCAGAGGAGGGGAT GCCT CCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1503 TTT GTAAGGTTGAGCAATGT CCGCATAGAGGAGGAGCAGCCAGAGGAGGGGAT GCCT CCA 1562 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1563 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1622 

Qy 1561 GTT ACCAT CT T GGAT GAT GAC CAT G CAGGCAT CTTC ACT T TT GAAT GT GAT AC TAT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1623 GT TAC CAT CT TGGAT GAT GACC AT G CAGG CAT CTT CACT T TT GAAT GT GAT AC TAT T CAT 1682 

Qy 1621 GT CAGT GAGAGT ATT GGT GTTAT GGAGGT CAAGGTT CT GCGGACAT C AGGT GCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1683 GT CAGT GAGAGT ATT GGT GT TAT GGAGGT CAAGGTT CT GC GGAC AT CAG GTGCCCGGGGT 1742 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I II I I II I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1743 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1802 

Qy 1741 GAAGACACATAT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GT 17 84 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1803 GAAGACACATAT GGG GAGT T GGAAT T CAAGAAT GAT GAAACT GT 184 6 

RESULT 11 
US-10-114-153-5 

; Sequence 5, Application US/10114153 
; Publication No. US20030185815A1 
; GENERAL INFORMATION: 
; APPLICANT : Padigaru, Muralidhara 



APPLICANT : 


Shenoy, 


Suresh 


APPLICANT: 


Kekuda, 


Ramesh 


APPLICANT: 


Rastelli 


, Luca 


APPLICANT: 


Mezes, Peter 


APPLICANT: 


Smithson 


, Glennda 


APPLICANT: 


Guo, Xia 


oj ia 


APPLICANT: 


Gerlach, 


Valerie 


APPLICANT: 


Casman, 


Stacie 


APPLICANT: 


Boldog, 


Ferenc 


APPLICANT: 


Li, Li 




APPLICANT: 


Zerhusen 


, Bryan 


APPLICANT: 


Tchernev 


, Velizar 


APPLICANT: 


Gangolli 


, Esha 


APPLICANT: 


Vernet, 


Corine 


APPLICANT: 


Spytek, 


Kimberly 


APPLICANT: 


Malyanka 


r, Uriel 


APPLICANT: 


Patturaj 


an, Meera 


APPLICANT: 


Miller, 


Charles 


APPLICANT: 


Taupier, 


Raymond J. Jr. 


APPLICANT: 


Heyes, Melvyn 


APPLICANT: 


Ju, Jingfang 


APPLICANT: 


Peyman, 


John 


APPLICANT: 


Catterton, Elina 


APPLICANT: 


MacDougall, John 


APPLICANT: 


Edinger, 


Shlomit 


APPLICANT: 


Stone, David 


APPLICANT: 


Mazur, Ann 



; TITLE OF INVENTION: NOVEL ANTIBODIES THAT BIND TO ANTIGENIC POLYPEPTIDES, 
NUCLEIC ACIDS 

; TITLE OF INVENTION: ENCODING THE ANTIGENS, AND METHODS OF USE 

; FILE REFERENCE: 21402-322A 

; CURRENT APPLICATION NUMBER: US/10/114,153 

; CURRENT FILING DATE: 2002-08-06 

; PRIOR APPLICATION NUMBER: 60/281086 

; PRIOR FILING DATE: 2001-04-03 

; PRIOR APPLICATION NUMBER: 60/281906 

; PRIOR FILING DATE: 2001-04-05 

; PRIOR APPLICATION NUMBER: 60/282020 

; PRIOR FILING DATE: 2001-04-06 

; PRIOR APPLICATION NUMBER: 60/282930 

; PRIOR FILING DATE: 2001-04-10 

; PRIOR APPLICATION NUMBER: 60/283512 

; PRIOR FILING DATE: 2001-04-12 

; PRIOR APPLICATION NUMBER: 60/2,834 44 

; PRIOR FILING DATE: 2001-04-12 

; PRIOR APPLICATION NUMBER: 60/283657 

; PRIOR FILING DATE: 2001-04-13 

; PRIOR APPLICATION NUMBER: 60/283710 

; PRIOR FILING DATE: 2001-04-13 

; PRIOR APPLICATION NUMBER: 60/283678 

; PRIOR FILING DATE: 2001-04-13 

; PRIOR APPLICATION NUMBER: 60/284234 

; PRIOR FILING DATE: 2001-04-17 

; Prior Application data removed - See File Wrapper or PALM. 

; NUMBER OF SEQ ID NOS : 251 

; SEQ ID NO 5 

LENGTH: 2 685 



; TYPE: DNA 

; ORGANISM: Homo sapiens 

FEATURE : 

NAME/ KEY: CDS 
; LOCATION: (1)..(2685) 
US-10-114-153-5 

Query Match 91.0%; Score 1694.8; DB 15; Length 2685; 

Best Local Similarity 98.2%; Pred. No. 0; 

Matches 1725; Conservative 0; Mismatches 27; Indels 4; Gaps 1; 

Qy 86 GAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGCACAGGGCAGAACAATGAGTCCTGTT 145 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I 
Db 2 GAT C C GAGGCT G GT G GCT CAGG GGAC GT G C CAAGC ACAG GGCAGAACAAT GAGT C CTGT T 61 

Qy 146 C AG GGT CAT C GGACT GCAAGGAG GGT GT CAT CCTGC CAAT CT GGT AC C C GGAGAAC C CT T 2 05 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 62 CAGGGT CAT C GGACT GCAAGGAG GGT GTC AT C CT GC CAAT CT GGT ACC C GGAGAAC CCT T 121 

Qy 206 CCCTTGGGGACAAGATTGCCAGGGTCATTGTCTATTTTGTGGCCCTGATATACATGTTCC 265 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 122 CCCTTGGGGACAAGATTGCCAGGGTCATTGTCTATTTTGTGGCCCTGATATACATGTTCC 181 

Qy 2 66 TT GGG GT GT C CAT CAT T GCTGAC C GCT T C AT GGCAT CTAT TGAAGT CAT CACCT CT CAAG 325 

I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 182 TT GGG GT GT C CAT CAT T GCT GAC C GCT T CAT GGCAT CTAT TGAAGT CAT CAC CTCT CAAG 241 

Qy 326 AGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAAACCAGCACAACCACTATT CGGGTCT 385 

I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 242 AGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAAACCAGCACAACCACTATT CGGGTCT 301 

Qy 386 G GAAT GAAAC T GT CT C CAAC CT GAC C CT T AT GGC C CT GGGT TCCTCTGCTCCT GAGAT AC 445 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 302 GGAATGAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATAC 361 

Qy 446 TCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTA 505 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 362 TCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTA 421 

Qy 506 CCATTGTAGGGAGTGCAGCCTTCAACATGTTCATCATCATTGGCATCTGTGTCTACGTGA 565 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 422 CCATT GTAGGGAGT GCAGCCTT CAACATGTTCATCAT CATTGGCAT CTGT GT CTACGTGA 481 

Qy 566 TCCCAGACGGAGAGACTCGCAAGATCAAGCATCTACGAGTCTTCTTCATCACCGCTGCTT 625 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 82 TCCCAGACGGAGAGACT CGCAAGAT CAAACATCTACGAGT CTTCTT CATCACCGCT GCTT 541 

Qy 626 GGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGG 685 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 542 GGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGG 601 

Qy 686 TCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCT 745 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I 
Db 602 TCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCT 661 

Qy 746 GG GT GGCAGAT AAAC GACT GCT C TT CTACAAAT ACAT GC ACAAAAAGT AC CGCAC AGACA 805 

I II I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I II I I I I II I I 



Db 


662 


GGGTGGCAGATAAACGACT GCT CTT CTACAAATACAT GCACAAAAAG 1 AOLGLAOAGACA 


1 O 1 

/ z 1 


Qy 


806 


AACACCGAGGAATTAT CATAGAGACAGAGGGTGACC ACCCTAAGGGCATT GAGATGGAT G 


865 




| | I | | | I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


722 


AAC AC C GAGGAAT TAT CAT AGAGACAGAG G GT GAC CAC C CTAAGGGCAT T GAGA I G GA 1 G 


/ O 1 


Qy 


866 


GGAAAAT GAT GAATT CCCAT TT T CTAGAT GGGAACCT GGT GCCCCT GGAAGGGAAGGAAG 


925 




1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 I 1 1 1 1 1 I 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 I 1 1 1 II 1 1 1 1 1 1 1 




Db 


782 


GGAAAAT GAT GAATT CCCAT TTT CTAGAT GGGAACCT GGT GC CCCTGGAAGGGAAGGAAG 


O /I 1 

841 


Qv 


926 


T G GAT GAGT CC C GCAGAGAGAT GAT C CGGAT T CT CAAGGAT CT GAAGCAAAAACAC CC AG 


985 




I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


842 


TGGAT GAGT C CC GCAGAGAGAT GAT C CG GATT CT CAAGGAT CT GAAGCAAAAACAC C C AG 


901 


Qv 


986 


AGAAGGACT T AGAT C AGCT GGT GGAGAT GGCCAAT TACT AT G CT CT T T C CCAC C AACAGA 


1045 




I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


902 


AGAAGGACTTAGATCAGCTGGTGGAGATGGCCAATTACTATGCTCTTTCCCACCAACAGA 


a f t 

961 


Qy 


1046 


AGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGTATGATGACTGGTGCAGGCAATATCC 


1105 




I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 




Db 


962 


AGAGC C GC G CCT T CT AC C GT AT CCAAGC C ACT C GT AT GAT GACT G GT GC AGG CAAT AT C C 


1021 


Qv 


1106 


T GAAGAAACATGCAGCAGAACAAGCCAAGAAGGCCT CCAGCAT GAGCGAGGT GCACACCG 


1165 




I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1022 


TGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCCTCCAGCAT GAGCGAGGT GCACACCG 


1081 


Qv 


1166 


ATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTACCAGTGCCTGG 


1225 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1082 


ATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTACCAGTGCCTGG 


1141 


Qv 


1226 


AGAACT GT GGGGCT GTACT CCT GACAGT GGT GAGGAAAGGGGGAGACATGT CAAAGACCA 


1285 




M 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 I 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 




Db 


1142 


AGAACT GT GGGGCT GTACT CCT GACAGT GGT GAGGAAAG GGGGAGACAT GT CAAAGAC C A 


T O A T 

lZOl 


Qy 


1286 


T GT AT GT GGACT ACAAAACAGAGGATGGTTCT GCCAAT GCAGGGGCT GACTAT GAGTT CA 


1345 




I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1202 


T GT AT GT GGACTACAAAACAGAGGAT GGT T CT GC CAAT GCAGGGGCT GACT AT GAGTT CA 


T O /C T 

IZfel 


Qy 


1346 


CAGAGGGC ACG GT GGTT CT GAAGC CAGGAGAGAC C CAGAAGGAGT TCT CCGT GGGCATAA 


1405 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1262 


CAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACCCAGAAGGAGTTCTCCGTGGGCATAA 


TOOT 

lizl 


Qy 


1406 


TTGATGACGACATTTTTGAGGAGGATGAACACTTCTTTGTAAGGTTGAGCAATGTCCGCA 


1465 




I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1322 


TTGATGACGACATTTTTGAGGAGGATGAACACTTCTTTGTAAGGTTGAGCAATGTCCGCA 


TOOT 


Qy 


1466 


TAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCAGCAATATTCAACAGTCTTCCCTTGC 


1525 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1382 


T AGAGGAGGAG CAGC C AGAGGAGGGGAT GC CT CC AGCAAT AT T CAACAGT CTT C C CT T GC 


T /! /I T 
14 41 


Qy 


1526 


CTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGA1 GACCAI G 


lOO D 




I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1442 


CTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGATGACCATG 


1501 


Qy 


1586 


CAGGCATCTT CACTTTT GAAT GT GATACTATTCAT GT CAGT GAGAGT ATT GGTGTTAT GG 


1645 


Db 


1502 


I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 Ml 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 

CAGGCAT CTT CACTTTT GAAT GT GATACTATTCAT GT CAGT GAGAGT ATT GGT GTTAT GG 


1561 



Qy 164 6 AGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGTCATCGTCCCCTTTAGGACAG 1705 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1562 AGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGTCATCGTCCCCTTTAGGACAG 1621 

Qy 1706 TAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTTGAAGACACATATGGGGAGTTGGAAT 1765 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1622 T AGAAGGGACAG C CAAGG GT GGC GGT GAGGACT TT GAAGACACAT AT G GGGAGTT GGAAT 1681 

Qy 1766 T CAAGAAT GAT GAAACT GT AT GT GAC AGACAGGAAGCT GACT AT GGAAGAAGAGGAGGC C 1825 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I II I I I 

Db 1682 T CAAGAAT GAT GAAAC T GT GAAAAC CAT AAGGGTTAAAAT AGT AGAT GAG GAGGAA 1737 

Qy 1826 AAGAGGATAGCAGAGA 1841 

I I I I I I I 

Db 1738 TACGAAAGGCAAGAGA 1753 



RESULT 12 

US-10-029-386-20265 

Sequence 20265, Application US/10029386 
Publication No. US20030194704A1 
GENERAL INFORMATION: 
APPLICANT: Penn, Sharron G. 
APPLICANT: Rank, David R. 
APPLICANT: Hanzel, David K. 

TITLE OF INVENTION: HUMAN GENOME- DERIVED SINGLE EXON NUCLEIC ACID PROBES 
USEFUL FOR GENE 

TITLE OF INVENTION: EXPRESSION ANALYSIS TWO 
FILE REFERENCE: AEOMICA-X-2 

CURRENT APPLICATION NUMBER: US/ 10/ 029, 386 
CURRENT FILING DATE: 2001-12-20 
NUMBER OF SEQ ID NOS : 34288 

SOFTWARE: Annomax Sequence Listing Engine vers. 1.1 
SEQ ID NO 20265 
LENGTH: 82 3 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE : 

MAP TO AL160191.1 
EXPRESSED IN LUNG, SIGNAL 
EXPRESSED IN FETAL LIVER, 
EXPRESSED IN ADULT LIVER, 



OTHER INFORMATION: 
OTHER INFORMATION: 
OTHER INFORMATION: 
OTHER INFORMATION: 
OTHER INFORMATION: 
OTHER INFORMATION: 
OTHER INFORMATION: 
US-10-029-386-20265 



= 1.7 

SIGNAL =1.7 
SIGNAL = 1.6 



SWISSPROT HIT: P57103, EVALUE 0.00e+00 
EST_HUMAN HIT: BI913344.1, EVALUE 0.00e+00 
NT HIT: gil5147253, EVALUE 0.00e+00 



Query Match 44.1%; 
Best Local Similarity 99.9%; 
Matches 822; Conservative 



Score 821.4; DB 15; 
Pred. No. 1.6e-259; 
0; Mismatches 1; 



Length 823; 
Indels 0; 



Gaps 



0; 



Qy 



Db 



4 32 TGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGA 491 
I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I M I I 
1 TGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGA 60 



Qy 4 92 T CT GGGACCTT CT ACCATTGTAGGGAGTGCAGCCTT CAACATGTTCAT CAT CATTGGCAT 551 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 61 T CTGGGAC CTT CTACCATT GT AGGGAGT GCAGCCTTCAACAT GT T CAT CAT CATT GGCAT 120 

Qy 552 CT GT GT CT AC GT GAT CCCAGAC GGAGAGACT CGCAAGAT CAAGCAT CTACGAGTCTT CTT 611 

I I I I I I I I I I I I I II I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 121 CTGTGTCTACGTGATCCCAGACGGAGAGACTCGCAAGATCAAGCATCTACGAGTCTTCTT 180 

Qy 612 CAT CACC G CT GCTT GGAGTAT CTT T GC CT ACAT CT GG CT CT AT AT GAT T CT GGC AGT CT T 671 

I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTT 24 0 

Qy 672 CTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTG 731 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 CTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTG 300 

Qy 7 32 TGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATACATGCACAAAAA 791 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 TGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATACATGCACAAAAA 360 

Qy 7 92 GT AC C G C AC AG AC AAAC AC C GAG G AAT TAT C AT AG AG AC AGAG G GT GAC C AC C C T AAG G G 851 

| I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GT AC C GC AC AGACAAACACC GAG GAATT AT CAT AGAGACAGAGG GT GACCAC C CTAAG GG 420 

Qy 852 CAT T GAGAT GGAT GGGAAAAT GAT GAAT T C C CAT TTT CT AGAT GGGAACC T GGT GCC C CT 911 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CAT T GAGAT GGAT G GGAAAAT GAT GAAT T C C CAT T TT CT AGAT G G GAACCT GGT GCC C CT 480 

Qy 912 GGAAGGGAAGGAAGTGGATGAGT CCCGCAGAGAGATGATCCGGATTCT CAAGGAT CT GAA 971 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 4 81 GGAAGG GAAGGAAGT GGAT GAGT C CC GCAGAGAGAT GAT C C GGAT T CT CAAGGAT CT GAA 54 0 

Qy 972 GCAAAAACAC CCAGAGAAGGACT T AGAT CAGCT GGT GGAGAT GGC CAATT ACT AT G CT CT 1031 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 GCAAAAACAC C CAGAGAAGGACT T AGAT CAGCT G GT G GAGAT GGC CAATT ACT AT GCT CT 600 

Qy 1032 TT C C C AC CAACAGAAGAGC C G C GC CT T CT AC C GT AT C C AAGC CACT C GT AT GAT GACT GG 1091 

I | | | I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I 
Db 601 TTCCCACCAACAGAAGAGCC GTGCCTT CTACCGTAT CCAAGCCACT CGTAT GAT GACTGG 660 

Qy 1092 TGCAGGCAATATCCTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCCTCCAGCATGAG 1151 

I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 661 T GCAGGCAATAT C C T GAAGAAAC AT GCAGCAGAACAAGC CAAGAAG G CCT C CAGCAT GAG 72 0 

Qy 1152 CGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTC 1211 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 C GAG GT G C AC AC C GAT GAG CCT GAG GAC T T TAT T T C C AAG GTCTTCTTT GAC C CAT GT T C 780 

Qy 1212 TTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTG 1254 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 81 TTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTG 82 3 



RESULT 13 
US-09-901-419-1 

; Sequence 1, Application US/09901419 
; Patent No. US20020069421A1 
; GENERAL INFORMATION : 



APPLICANT: The Curators of the University of Missouri 

TITLE OF INVENTION: LARGE SCALE EXPRESSION AND PURIFICATION OF RECOMBINANT 
TITLE OF INVENTION: PROTEINS 
FILE REFERENCE: UM01531.1 

CURRENT APPLICATION NUMBER: US/09/901, 419 
CURRENT FILING DATE: 2001-07-09 
PRIOR APPLICATION NUMBER: 60/218,125 
PRIOR FILING DATE: 2000-01-13 
NUMBER OF SEQ ID NOS : 2 
SOFTWARE : PatentlnVer. 2.1 
SEQ ID NO 1 
LENGTH: 4087 
TYPE: DNA 

ORGANISM: Bos taurus 
FEATURE : 
NAME/ KEY: CDS 
LOCATION: (268) . . (3180) 
NAME/ KEY : s ig_peptide 
LOCATION: (268) . . (363) 
NAME/ KEY: misc_feature 
LOCATION: (3178) 

OTHER INFORMATION: A Poly (H) affinity tag comprising 6 His residues 
OTHER INFORMATION: have been inserted at the C-Terminus end of the 
OTHER INFORMATION: coding region of the protein 
US-09-901-419-1 

Query Match 43.5%; Score 810.6; DB 9; Length 4087; 

Best Local Similarity 68.5%; Pred. No. 1.6e-255; 

Matches 1211; Conservative 0; Mismatches 519; Indels 39; Gaps 5; 

Qy 46 TTTGGGCTGGTTACCTTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCA 105 

III I I I I I I I I I I I I I I II I I Ml 

Db 307 TTTCACGTGATAGCCATGGTGGCTCTCTTGTTTTCCCATGTGGACCATATAAGTGCTGAG 366 

Qy 106 GGGGACGTGCCAAGCACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAG 165 

I I I I I I I I I I I I I I III I II II I till 111 

Db 367 ACAGAAAT GGAAGGAGAAGGCAAC GAGACT GGC GAGT GTACT GG CT C CTAT TACT GT AAG 426 

Qy 166 GAGGGTGTCATCCTGCCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCC 225 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I II I I I 
Db 427 AAGG GGGT GAT TT T AC C CAT T T GGGAGCCC CAGGAC CCTTCCTT T GGAGACAAAATT GCT 486 

Qy 226 AGGGTCATTGTCTATTTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCT 285 

II I I III I I I I I I I I I I I I II I I I I I I I I I I I I I I II M I I I I II I I I 

Db 4 87 AGAG CGACT GT GT ATT T T GT GG C CAT GGT CT AC AT GT T T CTT GGAGT CT CAAT CAT T GCT 54 6 

Qy 286 GACCGCTTCAT GGCAT CTATTGAAGTCATCACCTCT CAAGAGAGGGAGGT GACAATTAAG 345 

I I I I I I I I I I I I Mill I I I I I I I I I I I I I I I I I I I I I II I I I II III 

Db 547 GAC C GGT T CAT GT C CT CT ATAGAAGT CAT CACGT CT CAAGAGAAAGAAAT CAC CAT AAAG 606 

Qy 34 6 AAAC C CAAT G GAG AAAC CAGCACAACCACTATT CGGGTCT GGAATGAAACTGT CTCCAAC 405 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II 
Db 607 AAACC CAAT GGAGAGAC CAC CAAGACAACT GT GAGGAT CT GGAAT GAGACAGT GT CCAAC 666 

Qy 406 CTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTG 465 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I 
Db 667 CTGACCTTGATGGCCCTGGGGTCTTCAGCTCCAGAGATTCTCCTTTCAGTAATCGAGGTG 726 



Qy 4 66 TGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCC .525 

I I I I I III I I I I III II II II II II I I I I II II I I I I I I I I II 

Db 727 TGTGGCCATAACTTCACTGCAGGAGACCTTGGCCCTAGCACCATCGTGGGGAGTGCTGCA 786 

Qy 52 6 T T C AACAT GT T CAT CAT CAT T G GC AT C T GT GT CT AC GT GAT C C C AGAC GGAGAGAC T C G C 585 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 7 87 T T CAACAT GT T CAT CAT CAT T GCC CTT T GT GT GT AT GT CGT C CC GGAT GGG GAGACAAGG 846 

Qy 586 AAGATCAAGCATCTACGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATC 645 

I I I I I I I I I I I I I I II II I I I I I I M M M I I I I I I I I I I I I I I I I I I 

Db 8 47 AAGATCAAGCATCT GCGT GT GTTCTTT GTGACAGCAGCATGGAGCATCTTT GCCT ATACC 906 

Qy 646 TGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTC 705 

I I I I I I I I I I II I I I I I I 1111111111111 I I I I I I I I I I I I I 

Db 907 TGGCTTTACATCATTTTGTCTGTCAGCTCCCCTGGGGTCGTGGAGGTCTGGGAAGGTTTG 966 

Qy 706 CTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTG 765 

I | | I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I III 
Db 967 CTTACTTTCTTCTTCTTCCCCATCTGCGTTGTGTTTGCTTGGGTGGCAGACAGGAGGCTT 1026 

Qy 7 66 CT CTT CT ACAAAT AC AT GCACAAAAAGT AC C GC ACAGACAAACAC CGAGGAATT AT CAT A 825 

I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 1027 CTGTTTTACAAGTATGTCTACAAGAGGTATCGGGCTGGCAAGCAGAGGGGAATGATTATT 1086 

Qy 826 GAG AC AG AG G GT G AC C AC C C T AAG GGCAT T GAGAT GGAT GGGAAAAT GAT G 87 6 

II II I I I I I II I I I I I I I I I I I I I I I I I II I I I 

Db 1087 GAACAC GAAGGAGACAGGCC AT CT T C CAAGAC AGAAAT T GAAAT GGAT GGGAAAGT G GT C 1146 

Qy 877 AATTCCCA TTTTCTAGATGGGAACCTGGTGCCCCTGGAAGGGAAG 921 

I I I I I I I I III I I I I I I I I I I I I I I II I II 

Db 1147 AATTCCCATGTTGACAGTTTCTTAGATGGAGCCCTGGTTCTGGAGGTTGATGAGAGGGAC 1206 

Qy 922 GAAGT GGAT GAGT C CCGC AGAGAGAT GAT C C GGAT T CT CAAGGAT CT GAAGCAAAAA 97 8 

III I I I I I I I I I II I I I I I I I II I I I I I I I I I 

Db 1207 CAAGAT GAT GAAGAAGC C AG G CGAGAAAT GG CT AGGAT T CT GAAGGAACT CAAGCAGAAG 12 66 

Qy 979 CACCCAGAGAAGGACTTAGATCAGCTGGTGGAGATGGCCAATTACTATGCTCTTTCCCAC 1038 

I I I I I I I I I I I I II I I M I I I I I I I I I I I I I II 

Db 1267 CAT CCAGAGAAGGAAATAGAGCAATTAATAGAATTAGCCAATTACCAAGT CTTAAGTCAG 1326 

Qy 1039 CAAC AGAAGAGC C GC GC CT T CTAC C GT AT C CAAGCCACT C GT AT GAT GAC T GGT GCAGGC 1098 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1327 CAGCAAAAAAGTCGAGCGTTTTACCGTATTCAAGCTACCCGCCTGATGACCGGAGCAGGC 1386 

Qy 1099 AAT AT CCT GAAGAAAC AT GCAG C AGAACAAGC CAAGAAGGCCT CC AG CAT GAG C GAGGT G 1158 

MM I II II I I II I I I I I I I I II II II I I I II I II II I I Mill 
Db 1387 AACAT T T T AAAGAGGC AT GCAGC AGAC CAAGC CAGGAAAGCT GT CAGCAT GC AT GAGGT C 1446 

Qy 1159 CACAC C GAT GAGC CT G AGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTAC 1215 

M I I II I I I II I I I I II II I I I II II I I I I I I I Ml 

Db 1447 AACAC GGAAGT G GCT GAAAAT GACC CT GT C AGT AAGAT CT T CTT TGAACAAGGGACATAT 1506 

Qy 1216 CAGT GC CT GGAGAACT GT GG GGCTGT ACT C CT GAC AGT G GTGAGGAAAGGGGGAGACAT G 1275 

I I I I I II I I I II I II I I II I I I I I II I II I I I I II I I I II II 
Db 1507 CAGT GT CT G GAGAACT GT GGC ACAGT AGC C CT GAC CATT AT C C GC AGAGGT GGT GATTT G 1566 



Qy 

Db 



1276 
1567 



T CAAAGAC CAT GT AT GT GGACTACAAAAC AGAGGAT GGTT CT GC CAAT GCAGG GGCT GAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MM 

ACCAACACT GT GTT T GTT GACT T CAGAAC AGAGGAT G GCACAGC CAAT G CT G GAT CT GAT 



1335 
1626 



Qy 1336 TAT GAGT T CACAGAGGGCAC G GT GGT T CT GAAGC CAG GAGAGAC C C AGAAGGAGTT CT CC 1395 

M M M I I M M M M I M I M M I M M M M M I M M I M 

Db 1627 T AC GAAT T T AC C GAAGGAACT GT GGT CTTTAAGC C T GGT GAGAC C CAGAAGGAAAT CAGA 1686 

Qy 1396 GT G G G C AT AAT T GAT GAC GAC AT T T T T GAG GAG GAT G AAC AC T T C T T T GT AAG GT T GAG C 1455 

II I II II I I I I I I II I I I II I I I I II I II II I II I I I I II I I I Ml 

Db 1687 GTTGGCAT CATT GAT GAT GACAT CTTTGAGGAGGATGAGAATTTCCTT GTGCAT CTCAGC 1746 

Qy 1456 AAT GT C C G CATAGAG GAGGAGC AGC CAGAGGAGGGGAT GC CT CCAG CAAT ATT C AAC AGT 1515 

I I I I I II III I I I I I I I II I Ml MM 

Db 1747 AAC GTCAAAGT AT C T TT G GAAGC CTC GGAAGAC G GCAT C CT G GAAG C CAGT 1797 

Qy 1516 CTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGAT 1575 

II II II III I I I I I I I II I I I I II M II I I II I I I 

Db 1798 CATGTCTCTACCCTTGCTTGCCTGGGATCCCCCTCCACTGCCACCGTGACTATTTTTGAT 1857 

Qy 1576 GAT GAC CAT GCAGGCAT CTT CACTTTT GAAT GTGAT ACT ATT CAT GTCAGT GAGAGTATT 1635 

I M II I I I II I II I I I I I I I II I II II I I II I I I I I II II II III 

Db 1858 GAT GAC C AT GCT G GCAT CTT T ACTTT T GAGGAAC C GGT GACT CAT GT GAGT GAGAGC ATT 1917 

Qy 1636 GGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGTCATCGTCCCC 1695 

II I I I II I I I I II I I I II I I I I II I I I I I II M I I I II I II M I 

Db 1918 GGCATCAT GGAGGT GAAAGTTCT GAGAACAT CTGGAGCACGT GGAAATGTTAT CGTT C CC 1977 

Qy 1696 TTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTTGAAGACACATATGGG 1755 

I II I I I I I I I I I I I II I I I I I I I I I I I II II I I I I I I I I II I I II 
Db 197 8 T ATAAGAC CAT T GAG GGGAC CGC CAGAGGT G GAGG GGAG GACTTT GAGGAC ACATGC G GA 2037 

Qy 1756 GAGT T GGAATT CAAGAAT GAT GAAACT GT 1784 

III I II III I I I II I I II I I III 

Db 2038 GAG CTC GAGT T C CAG AAT GAC G AAAT T GT 2066 



RESULT 14 

US-09-864-761-16939 

; Sequence 16939, Application US/09864761 

; Patent No. US20020048763A1 

; GENERAL INFORMATION: 

; APPLICANT: Penn, Sharron G. 

; APPLICANT: Rank, David R. 

; APPLICANT: Hanzel, David K. 

APPLICANT: Chen, Wensheng 
; TITLE OF INVENTION: HUMAN GENOME- DERIVED SINGLE EXON NUCLEIC ACID PROBES 
USEFUL FOR 

; TITLE OF INVENTION: GENE EXPRESSION ANALYSIS BY MICROARRAY 

; FILE REFERENCE: Aeomica-X-1 

; CURRENT APPLICATION NUMBER: US/09/864,761 

; CURRENT FILING DATE: 2 001-05-23 

; PRIOR APPLICATION NUMBER: US 60/180,312 

; PRIOR FILING DATE: 2000-02-04 

; PRIOR APPLICATION NUMBER: US 60/207,456 

; PRIOR FILING DATE: 2000-05-26 

; PRIOR APPLICATION NUMBER: US 09/632,366 



PRIOR FILING DATE: 2000-08-03 

PRIOR APPLICATION NUMBER: GB 2 4263.6 

PRIOR FILING DATE: 2000-10-04 

PRIOR APPLICATION NUMBER: US 60/236,359 

PRIOR FILING DATE: 2000-09-27 

PRIOR APPLICATION NUMBER: PCT/US01/00666 

PRIOR FILING DATE: 2001-01-30 

PRIOR APPLICATION NUMBER: PCT/US01/00667 

PRIOR FILING DATE: 2001-01-30 

PRIOR APPLICATION NUMBER: PCT/US01/00664 

PRIOR FILING DATE: 2001-01-30 

PRIOR APPLICATION NUMBER: PCT/US01/00669 

PRIOR FILING DATE: 2001-01-30 

PRIOR APPLICATION NUMBER: PCT/US01/00665 

PRIOR FILING DATE: 2001-01-30 

PRIOR APPLICATION NUMBER: PCT/US01/00668 

PRIOR FILING DATE: 2001-01-30 

PRIOR APPLICATION NUMBER: PCT/US01/00663 

PRIOR FILING DATE: 2001-01-30 

PRIOR APPLICATION NUMBER: PCT/US01/ 00662 

PRIOR FILING DATE: 2001-01-30 

PRIOR APPLICATION NUMBER: PCT/US01/00661 

PRIOR FILING DATE: 2001-01-30 

PRIOR APPLICATION NUMBER: PCT/US01/00670 

PRIOR FILING DATE: 2001-01-30 

PRIOR APPLICATION NUMBER: US 60/234,687 

PRIOR FILING DATE: 2000-09-21 

PRIOR APPLICATION NUMBER: US 09/608,408 

PRIOR FILING DATE: 2000-06-30 

PRIOR APPLICATION NUMBER: US 09/774,203 

PRIOR FILING DATE: 2001-01-29 

NUMBER OF SEQ ID NOS : 49117 

SOFTWARE: Annomax Sequence Listing Engine vers. 1.1 
SEQ ID NO 16939 
LENGTH: 1836 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE : 



; OTHER 


IN FORMATION : 


MAP TO AC007281.3 




OTHER 


INFORMATION: 


EXPRESSED 


IN FETAL LIVER, SIGNAL = 


0.64 


OTHER 


INFORMATION: 


EXPRESSED 


IN HELA, SIGNAL =0.68 




OTHER 


INFORMATION: 


EXPRESSED 


IN ADULT LIVER, SIGNAL = 


0.69 


OTHER 


INFORMATION: 


EXPRESSED 


IN HEART, SIGNAL =6.1 




OTHER 


INFORMATION: 


EXPRESSED 


IN LUNG, SIGNAL =0.83 




; OTHER 


INFORMATION: 


EXPRESSED 


IN BRAIN, SIGNAL =1.3 




OTHER 


INFORMATION: 


EXPRESSED 


IN PLACENTA, SIGNAL = 0. 


68 


OTHER 


INFORMATION: 


NT HIT: X91213.1, EVALUE 0.00e+00 




OTHER 


INFORMATION: 


EST_HUMAN 


HIT: AW452398.1, EVALUE 


0.00e+00 


; OTHER 


INFORMATION: 


SWISSPROT 


HIT: P32418, EVALUE 0.00e+00 


US-09-864- 


-761-16939 









Query Match 42.1%; Score 785.2; DB 9; Length 1836; 

Best Local Similarity 68.3%; Pred. No. 2.3e-247; 

Matches 1166; Conservative 0; Mismatches 503; Indels 39; Gaps 4; 

Qy 109 GACGTGCCAAGCACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAG 168 

II II II III I I I I I I I I I I I I II I I I I I I I I I 



Db 133 GAAAT GGAAG GAGAAGGAAAT GAAACT GGT GAAT GT ACT GGAT CAT AT TACT GT AAGAAA 192 

Qy 169 GGTGTCATCCTGCCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGG 22 8 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 193 GGGGTGATTTTGCCCATTTGGGAACCCCAAGACCCTTCTTTTGGGGACAAAATTGCTAGA 252 

Qy 229 GTCATTGTCTATTTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGAC 28 8 

I I III II I II I I I I I I I II I I I I I I I I I I I I I I II II I I I I I I I II I 

Db 253 GCTACTGTGTATTTTGTGGCCATGGTCTACATGTTTCTTGGAGTCTCTATCATAGCTGAT 312 

Qy 289 CGCTT CATGGCAT CT ATT GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAATTAAGAAA 34 8 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 313 CGGTT CAT GT CCT CT ATAGAAGT CAT CACAT CT CAAGAAAAAGAAATAACCAT AAAGAAA 372 

Qy 349 C C C AAT GGAGAAAC C AG C AC AAC C AC TAT T C G GGT C T GGAAT GAAACT GT CT C C AAC CT G 408 

I I I I I I I I I I I I II I II II III I II I I I I I I I I I I I I I II II I I I I I I 

Db 373 CCCAAT GGAGAGACCACCAAGACAACT GT GAGGAT CTGGAAT GAAACAGTTT CTAACCT G 432 

Qy 409 ACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGT 468 

III I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 433 ACCTTGATGGCCCTGGGATCTTCTGCTCCTGAGATTCTCCTTTCAGTAATTGAAGTGTGT 4 92 

Qy 469 GGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTC 52 8 

II III I I I I III II I I II II III I I I I I II II I I I I I II III 

Db 493 G GC CAT AAC T T CACT GCAGGAGACCT CGGT CCT AGCAC CAT C GT GGGAAGT GCT GCAT T C 552 

Qy 529 AAC AT GTT CAT CAT C ATT GGCAT CT GT GT CT AC GT GAT C C CAGAC GGAGAGACTC GCAAG 58 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 553 AATATGTT CATCATTATTGCACT CTGTGTTTAT GTGGT GCCT GACGGAGAGACAAGGAAG 612 

Qy 58 9 ATCAAGCATCTACGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGG 64 8 

II I I I I I I I II I I I I I I I I I II II II I M I I I I I I I I I I I I I I I I I I I 

Db 613 ATTAAGCATTTGCGTGTCTTCTTTGTGACAGCAGCCTGGAGCATCTTTGCCTACACCTGG 672 

Qy 64 9 CTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTC 708 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 673 CTTTACATTATTTTGTCTGTCATATCTCCTGGTGTTGTGGAGGTCTGGGAAGGTTTGCTT 732 

Qy 709 ACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTC 7 68 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 733 ACTTTCTTCTTCTTTCCCATCTGTGTTGTGTTCGCTTGGGTAGCGGATAGGAGACTTCTG 792 

Qy 769 T T CT AC AAAT AC AT G C AC AAAAAGT AC C G CAC AGAC AAAC AC CGAGGAAT TAT C AT AGAG 82 8 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 793 T T TT ACAAGT AT GT CT ACAAGAG GT AT CGAGCT GGCAAG CAGAGGGGGAT GAT TAT T GAA 852 

Qy 82 9 AC AGAG GGT GAC CAC C C TAAGGGCAT T GAGAT GGAT GGGAAAAT GAT GAAT 879 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 853 CAT GAAGGAGAC AGG C CAT CT T CTAAGACT GAAAT T GAAAT G GAC GGGAAAGT GGT CAAT 912 

Qy 88 0 TCCCATTTTCTAGATGGGAACCTGGTGCCCCTGGAAGGGAAG 921 

I I I I I I I I I I I I I I I I III 

Db 913 TCTCATGTTGAAAATTTCTTAGATGGTGCTCTGGTTCTGGAGGTGGATGAGAGGGACCAA 972 

Qy 922 GAAGT GGAT GAGT CC C GCAGAGAGAT GAT C C GGAT T CT CAAG GAT CT GAAGCAAAAACAC 981 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 973 GAT GAT GAAGAAGCT AGG C GAGAAAT GG CT AGGAT T CT GAAGGAACTT AAGCAGAAGCAT 1032 



Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



982 C C AGAGAAG G ACT T AGAT C AGCT GGT G GAGAT G GCCAAT T ACT AT GCT CT T T C C C AC C AA 1041 
I I I I I I I I I I II I I I I III I II I I I I I I I II I I I I 

1033 CCAGATAAAGAAATAGAGCAATTAATAGAATTAGCTAACTACCAAGT CCTAAGT CAGCAG 1092 

1042 C AGAAGAGC CGCGCCTT CT AC C GT AT C CAAGC C ACT C GT AT GAT GAC T GGT G C AGG C AAT 1101 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1093 CAAAAAAGT AGAGCAT T TT AT C GCAT T CAAGCT ACT C GC CT C AT GACT GGAG CT GG CAAC 1152 

1102 ATCCTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCCTCCAGCATGAGCGAGGTGCAC 1161 

II Mill I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I II 

1153 AT T T T AAAGAGG C AT GCAGC T GAC CAAGCAAGGAAGGCT GT CAGCAT GC ACGAGGT CAAC 1212 

1162 ACCGATGAGCCTG AGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTACCAG 1218 

II II I I Ml I I I I III I I I II I I II I I I I I I I I II III 

1213 ACT GAAGT GACT GAAAAT GACCCTGTT AGTAAGAT CTT CTTT GAACAAGGGACAT AT CAG 1272 

1219 T GC CT G GAGAACT GT GGGG CT GT ACT CCT GACAGT GGT GAGGAAAG GGGGAGACAT GT C A 1278 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

1273 T GT CT G GAGAACT GT G GT ACT GT GGCC CT T AC C ATT AT CCGCAGAGGT GGT GAT TT GACT 1332 

1279 AAGAC CAT GT AT GT GGACT AC AAAAC AGAGGAT GGT T CT GCCAAT GCAG G GGCT GACT AT 1338 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I 
1333 AACACT GTGTTT GTT GACTT CAGAACAGAGGAT GGCACAGCAAAT GCTGGGT CTGATTAT 1392 

1339 GAGT T C ACAGAG G GC AC GGT GGT T CT GAAGC C AGGAGAGAC C C AGAAGGAGTT CT C C GT G 13 98 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II III 
1393 GAATTTACT GAAGGAACTGT GGTGTT TAAGCCT GGT GATACCCAGAAGGAAATCAGAGTG 1452 

1399 GGC ATAATT GAT GAC GACAT TT T T GAGGAG GAT GAACACTT CTTT GT AAGGT T GAGCAAT 1458 

II II II I I I I I II II I I I I I I I I I I I I I I I I III I I I I I I I I I I I 
1453 GGT AT CAT AGAT GAT GAT AT CT T TGAGGAG GAT GAAAAT TT C CTT GT G CATCT CAG CAAT 1512 

1459 GT CC GCAT AGAG GAG GAGC AGCCAGAGGAGGG GAT GCCT CCAGCAAT AT T CAACAGT CT T 1518 

III II II I I I I I I I I I I I Ml II I I I 
1513 GT CAAAGT AT CT T CT GAAGCTT CAGAAGAT GGCAT ACT GGAAGC CAATCAT 1563 

1519 CCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGAT 1578 

I II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1564 GT T T CT ACACT T G CT T GC CT C GGAT CTCC CT C CACT GCCACT GTAACT AT TT T T GAT GAT 1623 

1579 GAC CAT GC AGGCAT CT T CACTT T TGAAT GT GAT ACT AT T CAT GT C AGT GAGAGT AT TGGT 1638 

I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1624 GACCAC GCAGGCATT TTT ACT T T T GAGGAAC CT GT GACT CAT GT GAGT GAGAGCAT T GGC 1683 

1639 GTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGTCATCGTCCCCTTT 1698 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
168 4 AT CAT G GAG GT GAAAGT ATT GAGAACAT CT G GAGCT C GAGGAAAT GTT AT C GT T C CAT AT 1743 

1699 AGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTTGAAGACACATATGGGGAG 1758 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II 
1744 AAAAC CAT C GAAGGGACT GCCAGAG GT GGAG GGGAGGAT TT T GAGGAC ACT T GTGGAGAG 1803 

1759 T T GG AAT T C AAGAAT GAT GAAACT GT AT 1786 

I I I I I I I I I I I I I I I I I I I III I 

1804 C T C G AAT T C C AGAAT GAT GAAAT T GT GT 1831 



RESULT 15 

US-10-062-674-1648 

Sequence 1648, Application US/10062674 
Publication No. US20040005559A1 
GENERAL INFORMATION: 
APPLICANT: Loring, Jeanne F. ; Kaser, Matthew R. 

TITLE OF INVENTION: MARKERS OF NEURONAL DIFFERENTIATION AND MORPHOGENESIS 
FILE REFERENCE: PA- 002 6-1 CIP 
CURRENT APPLICATION NUMBER: US/10/062 , 674 
CURRENT FILING DATE: 2002-01-30 
PRIOR APPLICATION NUMBER: US 09/625,102 
PRIOR FILING DATE: 2000-07-24 
NUMBER OF SEQ ID NOS : 2217 
SOFTWARE: PERL Program 
SEQ ID NO 1648 
LENGTH: 6106 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE : 

NAME/ KEY : mi s c_f ea tur e 

OTHER INFORMATION: Incyte ID No. US20040005559A1 221501.2 
US-10-062-674-1648 

Query Match 42.0%; Score 783.2; DB 16; Length 6106; 

Best Local Similarity 68.2%; Pred. No. 2.3e-246; 

Matches 1164; Conservative 0; Mismatches 503; Indels 39; Gaps 4; 

Qy 109 GACGT GCCAAGC ACAGG GCAGAACAATGAGT C CTGT T CAGGGT CAT C GGACT GCAAGGAG 168 

II II II III I III I I I I I I I 

Db 192 GAAAT GGAAGGAGAAGGAAAT GAAACTGGT GAAT GT ACT GGAT C AT ATTACT GT AAGAAA 251 

Qy 169 GGTGTCATCCTGCCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGG 228 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I 

Db 252 GGGGTGATTTTGCCCATTTGGGAACCCCAAGACCCTTCTTTTGGGGACAAAATTGCTAGA 311 

Qy 229 GTCATTGTCTATTTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGAC 288 

I I III I I I I I I I I I I I I II I I I I I I I I I I I I I I II II I II I I I I I I I 

Db 312 GCTACTGTGTATTTTGTGGCCATGGTCTACATGTTTCTTGGAGTCTCTATCATAGCTGAT 371 

Qy 28 9 C GCT T CAT GGC AT CT AT T GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAATTAAGAAA 34 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I 
Db 372 CGGTTCAT GTC CTCTATAGAAGTCATCACAT CTCAAAAAAAAGAAATAACCATAAAGAAA 431 

Qy 34 9 C C C AAT GGAGAAAC CAGC ACAAC C ACT ATT C GGGT CT GGAAT GAAACT GT CT CCAACCT G 408 

I I I I I I I I I I I INI II II II I I II I I I I I I I I I I I I I II I I I II I I I 
Db 432 C CCAAT GGAGAGAC CAC CAAGACAACT GT G AGGAT CT G GAAT GAAACAGTT T CTAAC CT G 491 

Qy 409 ACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGT 468 

III I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 492 ACCTTGATGGCCCTGGGATCTTCTGCTCCTGAGATTCTCCTTTCAGTAATTGAAGTGTGT 551 

Qy 469 GGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTC 528 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I 

Db 552 GGCCATAACTTCACTGCAGGAGACCTCGGTCCTAGCACCATCGTGGGAAGTGCTGCATTC 611 



Qy 



529 AACAT GTT CAT CAT CAT T GGCAT CT GT GT CT AC GT GAT CCCAGAC GGAGAGACT C GCAAG 58 8 



I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I 1 1 I II I 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 

Db 612 AATAT GTT CAT CATTATT GCACT CT GTGTTTAT GTGGT GCCT GACGGAGAGACAAGGAAG 671 

Qy 589 ATCAAGCATCTACGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGG 648 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 672 ATTAAGCATTTGCGTGTCTTCTTTGTGACAGCAGCCTGGAGCATCTTTGCCTACACCTGG 731 

Qy 649 CTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTC 708 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 732 CTTTACATTATTTTGTCTGTCATATCTCCTGGTGTTGTGGAGGTCTGGGAAGGTTTGCTT 791 

Qy 709 ACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTC 768 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 792 ACTTTCTTCTTCTTTCCCATCTGTGTTGTGTTCGCTTGGGTAGCGGATAGGAGACTTCTG 851 

Qy 769 T T CT AC AAAT AC AT GC ACAAAAAGT AC C G C AC AGAC AAAC AC C GAGGAATT AT C AT AGAG 828 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 852 T T TT ACAAGT AT GT CT ACAAGAGGT AT C GAG CT GG CAAG CAGAG GGGGAT GAT TAT T GAA 911 

Qy 82 9 AC AG AGG GT GAC C AC C C TAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAAT 879 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 912 CAT GAAGGAGACAGGCCAT CT T CT AAGACT GAAAT T GAAAT GGAC GGGAAAGT G GT CAAT 971 

Qy 88 0 TCCCATTTTCTAGATGGGAACCTGGTGCCCCTGGAAGGGAAG 921 

I I I I I I I I I I I I I I I I III 

Db 972 T CT C AT GT T GAAAAT TT CT T AGAT GGT GCT CT GGT T CT GGAGGT G GAT GAGAGGGACCAA 1031 

Qy 922 G AAGT G GAT G AGT C C C G CAGAG AG AT GAT C C G GAT T C T CAAG GAT C T G AAG C AAAAAC AC 981 

III I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1032 GAT GAT GAAGAAGCT AGGCGAGAAAT GG CT AGGAT T CT GAAGGAACTT AAG CAGAAGCAT 1091 

Qy 982 C CAGAGAAGGACTT AGAT CAGCT GGT GGAGAT GG C CAATT ACT AT GCT CTT T C C CAC CAA 1041 

I I I II I I I I I I I I I I I III I I I I I I I I I I II I I I I 

Db 1092 C CAGAT AAAGAAAT AGAGCAAT T AATAGAAT T AGCTAACT AC CAAGT C CT AAGT C AG C AG 1151 

Qy 1042 CAGAAGAGCC GCGC CT T CTAC C GT AT C CAAG CCACT C GT AT GAT GACT GGT GCAGGCAAT 1101 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1152 CAAAAAAGTAGAGCATTTTAT CGCATT CAAGCTACTCGCCTCAT GACT GGAGCT GGCAAC 1211 

Qy 1102 AT CCT GAAGAAACAT GC AGCAGAACAAGCCAAGAAGGC CT C CAGCAT GAGC GAG GT GCAC 1161 

II I I I I I I I I I I I I I . I I I I I I I I I I I I I I I I I I I I I II I I I I II 

Db 1212 ATTT T AAAGAG GCAT GC AGCT GAC CAAGCAAGGAAGG CTGT CAGCAT GCAC GAGGT CAAC 1271 

Qy 1162 ACCGATGAGCCTG AG GAC T T TAT T T C C AAG GT CT T CT T T GAC C CAT GT T CT T AC C AG 1218 

I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I 
Db 1272 ACT GAAGT GACT GAAAAT GAC CCT GTT AGT AAGAT CT T CTT T GAACAAGGGACAT AT C AG 1331 

Qy 1219 T GC CT GGAGAACT GTGG GGCT GT ACT C CT GAC AGT G GT GAGGAAAG GGGGAGAC AT GT CA 1278 

I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 1332 TGTCTGGAGAACTGTGGTACTGTGGCCCTTACCATTATCCGCAGAGGTGGTGATTTGACT 1391 

Qy 1279 AAGACC AT GT AT GT G GACT AC AAAAC AGAG GAT GGT T CT GC CAAT G CAGGGGCT GACT AT 1338 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1392 AAC ACT GT GT T T GT T GACTT CAGAACAGAGGAT GGC ACAGCAAAT GCT GG GTCT GAT TAT 1451 

Qy 1339 GAGT T C ACAG AGGGCAC GGT G GT T CT GAAG C C AGGAGAGAC CCAGAAGGAGTT CT C C GT G 1398 

I | I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I II 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



14 52 GAAT T T ACT GAAGGAACT GT G GT GT TT AAGC CT GGT GAT AC C C AGAAGGAAAT CAGAGT G 1511 

1399 GGCAT AAT T GAT GAC GAC AT T T T T GAG GAG GAT G AAC ACT T CT T T GT AAGGT T GAG CAAT 1458 

II II II Mill II II II I I II I I I I I I II I I III I I II I I I I I I I 

1512 GGT AT C AT AGAT GAT GAT AT C T T T GAG GAGGAT GAAAATT T C CT T GT GCAT CT CAGCAAT 1571 

1459 GTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCAGCAATATTCAACAGTCTT 1518 

Ml II II I I I I I I I I I I I III I I I I I 

1572 GTCAAAGTAT CTTCT GAAGCTTCAGAAGAT GGCAT ACT GGAAGC CAATCAT 1622 

1519 CCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGAT 157 8 

I || I I I I I I I I I I I I I I I I I I I II I I II I I I I I I 

1623 GTTTCTACACTTGCTTGCCTCGGATCTCCCTCCACTGCCACTGTAACTATTTTTGATGAT 1682 

157 9 GAC CATGCAGGCAT CTT CACTTTT GAAT GT GATACTATTCATGT CAGT GAGAGTATT GGT 1638 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

1683 GAC C AC GCAGGCAT T TT TACT TTT GAG GAAC CT GT GACT CAT GT GAGT GAGAGCATT G GC 1742 

1639 GTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGTCATCGTCCCCTTT 1698 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II I I 
1743 AT CAT G GAGGT GAAAGT ATT GAGAAC AT CT GGAGCT C GAG GAAAT GT TAT C GTT C CAT AT 1802 

1699 AGGACAGT AGAAG GGACAGC CAAGGGT GGC G GT GAGGACT T T GAAGACAC AT AT GGGGAG 1758 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1803 AAAAC CAT C G AAG GG AC T G C C AG AG GT G GAG G G GAG GAT TTT GAG GAC AC T T GT G GAG AG 1862 

1759 T TGGAAT T CAAGAAT GAT GAAACT GT 17 84 

I I I I I I I I I I I I I I I I I M Ml 

1863 C T C GAAT T C C AG AAT GAT GAAAT T GT 188 8 



Search completed: June 25, 2004, 16:08:49 
Job time : 760.008 sees 



